基金项目:国家自然科学基金青年基金项目(41701499)及四川省科技厅重点研发项目(2018GZ0265)联合资助.
通讯作者:鲁恒(1984-),男,四川眉山人,博士,主要从事3S技术集成应用研究.E-mail:luheng@scu.edu.cn
(1.四川大学 水力学与山区河流开发保护国家重点实验室,四川 成都 610065; 2.四川大学 水利水电学院,四川 成都 610065; 3.成都市规划信息技术中心,四川 成都 610042)
(1. State Key Laboratory of Hydraulics and Mountain River Engineering,Sichuan University,Chengdu 610065,Sichuan,China)(2. College of Hydraulic and Hydroelectric Engineering,Sichuan University,Chengdu 610065,Sichuan,China)(3. Chengdu Planning Information Technology Center,Chengdu 610042,Sichuan,China)
object-oriented classification; multiresolution segmentation; the SEaTH algorithm; UAV images
在地震这种重大自然灾害面前,快速有效地从遥感影像中提取震区土地利用信息,在灾情评估及灾后重建中发挥着重要作用。选取四川省芦山地震灾区无人机影像为数据源,运用面向对象的影像分析方法,首先研究了多尺度分割中参数的选择,获取了研究区最优分割参数; 然后考虑了各个“影像对象”的数字化特征值,利用改进的SEaTH算法进行特征值优化处理; 最后采用了隶属度信息提取方法,获得了芦山地震灾区无人机低空遥感影像分类图,并进行了分类精度评估,结果表明:研究区影像的分类总精度为87.5%,kappa系数为0.835。
Before an earthquake that is believed to be a major natural disaster,how to quickly and efficiently extract the area of land use information from remote sensing images,plays a role in the evaluation of the disaster and post-disaster reconstruction. In this study,we select UAV images of the Lushan earthquake stricken areas in Sichuan province as data sources and apply an object-oriented image analysis method. Firstly,the selection of parameters in multi-scale segmentation is studied,and the optimal segmentation parameters are obtained. Then,the digital eigenvalue of each image object is considered,and the improved SEaTH algorithm is used to optimize the eigenvalue optimization. Finally,the classification of low-altitude remote sensing images in the Lushan earthquake area is obtained by using the method of membership information extraction,and the classification accuracy is evaluated. The results show that the total accuracy of the classification is 87.5%,and the Kappa coefficient is 0.835. Through the study of this paper,it can provide technical support for the rapid acquisition of geospatial source data of earthquake disaster areas.
我国是一个自然灾害频发且种类繁多的国家,如何有效地获取与监测灾情信息、做出科学可行的应急救灾措施,是当前研究的重点和难点。以遥感技术为主要手段来获取多时相、多分辨率、多类型的遥感数据及遥感图像处理技术一直以来都被应用于各种自然灾害防治的各个环节之中(曾涛,2010)。
北京时间2013年4月20日8时2分在四川省雅安市芦山县(30.3°N,102.95°E)发生了7.0级地震,震中位于芦山县庙坪上,震源深度13 km。在地震灾区通信、交通被严重破坏的情况下,无人机低空遥感技术成为快速获取震区灾情信息的最佳途径。因此快速准确地处理地震灾区遥感影像数据、对影像信息进行分类、提取出震害信息是值得深入研究的问题。本文所选研究区位于芦山地震灾区,该区域为平原地貌,具有建筑用地、林地、道路、耕地、地震临时安置房等典型的地物类型,分布较为均匀,该区域在高分辨率影像中具有一定的代表性。本文综合分析获取的地震灾区遥感影像数据,结合地震发生后实际情况及灾后应急救灾、灾害评估及重建的实际需要,利用无人机航拍的芦山地震震后高空间分辨率遥感影像,以面向对象影像分析技术对影像进行了信息提取,对建筑用地、林地、道路、耕地、地震临时安置房等准确地进行了分类。
在面向对象的分类过程中,被用于分类的遥感影像特征多种多样,如光谱特征、纹理特征、形状特征等。随着研究的深入,许多特征被进一步引用和演变,成为更有用的信息用以分类。与传统基于面向像元的分类方法相比,面向对象的分类方法不仅充分利用影像的光谱特征和纹理特征,还将形状特征和更多的特征运用联系起来,充分调动起了地物的特性,也提高了分类的准确度和可分性(江华,2014)。但如果使用的特征变量太多,会带来特征冗余,造成特征“维灾难”(郑云云,2015)。为了解决上述问题,一些分类特征选择方法被相继提出,如基于遗传算法的特征选择选择算法(冯莉等,2008)、基于Bayes错误率上界最小的特征选择算法(张振平,2006)、基于蚁群优化的特征选择算法(叶志伟等,2007)、基于关联规则的特征选择方法(何小晨,徐守时,2002)、基于特征知识库的遥感信息提取研究(高伟,2010)、SEaTH算法(Nussbaum et al,2006)。其中SEaTH算法是目前比较具有代表性的面向对象的特征选择方法,但是该算法仅从类间距离对特征进行评价,没有考虑到类内距离的影响。因此本文综合考虑类间距离与类内距离的综合影响,并在利用特征进行规则分类之前,优选特征,去除相关性大的特征,降低特征维数。基于此,本文将改进的SEeTH算法运用于分类规则集的自动获取。
分离阈值法(SEaTH)是由Nussbaum 等(2006)提出的一种基于 Jeffries-Matudita 距离和高斯分布混合模型的分类特征选取与阈值计算方法,本文结合SEaTH算法,运用隶属度分类的模糊分类规则进行分类。SEaTH算法实施的主要步骤为(王贺等,2013):
(1)样本选择:从分割后的影像中选取约2.5%具有代表性且空间分布均匀的典型样本(薄树奎,丁琳,2010),并从eCognition Developer软件中输出各样本的待选特征值。
(2)计算巴氏距离B值:
B=1/8(m1-m2)22/(σ12+σ22)+1/2ln[(σ12+σ22)/(2σ1σ2)](1)
式中:m1和m2表示2个类别的某特征均值,σ1和σ2表示2个类别的标准差。
(3)计算分离度J值:
J=2(1-e-B)(2)
(4)确定特征阈值:计算某特征的最佳阈值,把2个类的特征值看作高斯分布,根据该公式:
p(x)=p(x〖JB<1|〗C1)p(C1)+p(x〖JB<1|〗C2)p(C2)(3)
当p(x〖JB<1|〗C1)=p(x〖JB<1|〗C2)时,2种类别之间混分最少,而此时,当对应的特征值为x1时,类别C1和C2的分离性最好(如图1所示),x1便可作为特征阈值T,阈值T的计算公式如(5)、(6)所示:
A=ln(σ1n2)-ln(σ2n1)(4)
T+=1/(σ12+σ22)([m2σ12-m1σ22+
σ1σ2((m1-m2)2+2A(σ12-σ22))1/2](5)
T_=1/(σ12+σ22)([m2σ12-m1σ22-
σ1σ2((m1-m2)2+2A(σ12-σ22))1/2](6)
式中:σ1和σ2表示2个类别的某标准差,n1和n2表示2个类别的数目。
注:阈值T的计算公式有两个,取T介于m1和m2之间作为所要的阈值。
图1 C1和C2分离程度示意图
Fig.1 Schematic diagram showing the separation degree of C1 and C2
面向对象的分类方法充分利用了影像的光谱特征、纹理特征、形状特征和更多的特征,充分调动起地物的特性,从而提高了分类的准确度和可分性。由于使用的特征变量太多,造成了过度分类,使得分类混乱。因此在基于隶属度分类之前,先进行特征优选,然后进行特征去相关处理,去除相关性较大的若干特征。改进的SEaTH算法实施的主要步骤为(余晓敏等,2012):
(1)特征去相关:利用分割后的影像中具有代表性且空间分布均匀的典型样本,根据样本对象的特征值求出所有已选特征的自相关系数矩阵(吉小军等,2001)。设有设有N个特征,任意特征i,j=1,2…N,样本个数为K,自相关系数矩阵用r表示,那么这N个特征的自相关系数矩阵可表示为:
r=(r11 …… r1N
rN1 …… rNN)(7)
rij=(∑Kl=1(xli-x^-i)(xlj-x^-i))/((∑Kl=1(xli-x^-i)2)1/2∑Kl=1(xlj-x^-j)2)(8)
i,j=1,…,N
式中:xli表示特征集中第l个样本第i个特征的值; x^-i表示第i个特征的均值估计,x^-i=1/K∑Kl=1xli。
设置一个阈值依次遍历特征值的相关系数Yij,当某特征对的相关系数Yij大于某阈值时,去掉特征对中相关性强且特征方差较小的特征,由此降低特征矩阵的维度(谭艳丽,张丕状,2007)。本文经过多次实验,设定相关系数Yij的阈值为0.95。
(2)类间距离优化特征:利用(1)中优选的特征集,计算所有类别两两之间的类间距离J,并按特征值降序排列,取类间距离最大的前10个特征。
(3)特征归一化处理:由于所选特征的数量级大小不一,因此对已优化特征进行归一化处理,以便下一步筛选,处理后使其大小介于0~1之间,特征归一化公式为:
f=(f-fmin)/(fmax-fmin)(9)
式中:f为所选特征值,fmax为所选特征最大值,fmin所选特征最小值。
(4)类内距离特征优化:依次遍历C1和C2类中的抽选样本,并计算各个样本与其他同类样本某一特征值(f1,f2,…,fn)的距离,并累积求和。分别得到C1和C2类的类内距离D1和D2。并根据样本数目的不同,分别对C1和C2类赋予权重,求得C1和C2类的加权类内距离D。
d=2/(k(k-1))∑kl=1∑km=l+1(f lj-f mj)2(10)
D=(k1d1+k2d2)/(k1+k2)(11)
式中:k为所选样本类别数,d为类内距离。
(5)构建分类评价准则Jf:采用类间距离和类内距离的比值作为分类评价准则。Jf值越大,说明特征的分离性越好,反正分离性越差。Jf的公式为:
Jf=J/D(12)
改进的SEaTH算法很大程度上的降低了特征集矩阵的维度,去除了相关性大的特征,又根据类间距离和类内距离优化了特征,降低了数据处理量,提高了分类效率。
提取地物信息的准确度是我们评判分类精度的首个标准指标。精度评价指标主要分为生产者精度、用户精度、总体精度和Kappa系数(牛兴丽,2008)。
总体精度(overall accuracy)为:
OA=(∑nij)/n(i=1,…,k)(13)
生产者精度(producer's accuracy)为:
PAj=(nij)/(n+j)(j=1,…,k)(14)
用户精度(user's accuracy)为:
UAi=(nij)/(ni+)(i=1,…,k)(15)
Kappa分析可以用于比较2个分类器的误差矩阵是否具有显著差别,产生的评价指标被称为K统计值,其计算公式为:
Kappa=(n∑ki=1nij-∑ki=1ni+ni+)/(n2-∑ki=1ni+ni+)(i=1,…,k)(16)
式中:n为无人机遥感影像总样本数,k为总的分类类别;
nij为在影像中被分为i类而在参考类别中属于j类的样本数目; ni+为被分为i类的样本数目:ni+=∑nij(j=1,…,k); n+j为参考类别为j的样本数目:n+j=∑nij(i=1,…,k)。
eCognition软件支持多个分割方法,针对不同的分割影像,选择合适的分割方法是有必要的。多尺度分割技术是eCognition软件中较为常用的一种分割方法,它在生成影像对象的过程中抽象化了高分辨率影像信息,把高分辨率像元的信息用分割后的影像与多边形属性进行存储,尽量减少影像细节信息的损失,把影像分割成具有具体意义的影像对象(杜柯磊等,2016; 丁晓英,2015)。基于原始遥感影像的情况配置合适的多尺度分割参数(Scale parameter)、形状参数(shape)、紧致度参数(compactness),从而得到地物分割的最小单元(Lu,et al,2011; 宋杨等,2012)。
以控制变量法来确定多尺度分割的最佳参数。将多尺度分割参数设为n,从100开始取值,以20为步长,直到取到200,然后选出最合适的分割尺度参数。形状参数先取为0.7,紧致度参数取为0.3。通过对地类的“破碎度”和“淹没度”进行评估,得到最优分割尺度参数为160; 将形状参数设为m,从0.4开始取值,以0.1为步长,直到取到0.7,然后选出最合适的形状参数。多尺度分割参数取为160,紧致度参数暂取为0.3。通过目视
表1 芦山地震无人机遥感影像最优分割参数
Tab.1 Optimal segmentation parameters from UAV remote sensing images of the Lushan earthquake
定性评估,得到最优形状参数为0.6; 将形状参数设为q,从0.1开始取值,以0.1为步长,直到取到0.4,然后选出最合适的紧致度参数。多尺度分割参数取为160,形状参数取为0.6。通过目视定性评估,得到最优紧致度参数为0.3。
由此本文确定出芦山地震无人机遥感影像最佳尺度,如表1所示。
由2.1节分析可知,实验组芦山地震无人机遥感影像选择的最优分割尺度为:多尺度分割参数为160、形状参数为0.6、紧致度参数为0.3,分割对象共1 494个。从分割后的影像中选取约2.5%具有代表性且空间分布均匀的典型样本,地物类型分别为:建筑用地(6个)、地震临时安置房(6个)、耕地(8个)、林地(8个)、道路(5个)、未利用土地(5个)。
在eCognition软件里提取了各种地物类型的样本,并选取影像对象的常用特征共计71个,其中光谱信息方面:亮度(brightness),层1(layer 1),层2(layer 2),层1(layer 3),混合差异值(max diff),层1标准差(sdt layer 1),层2标准差(sdt layer 2),层3标准差(sdt layer 3); 形状信息方面:区域(Area Pxl),边界长度(Border length),长度(length pxl),长/深度(length/thickness),长宽比(length/width),的像素点数目(Number of pixel),图像边界的真实边界(Rel.border to image Border),厚度(volume pxl),宽度(width pxl),非对称性(Asymmetry),边界指数(Border index)紧致度(Compactness),密度(Density),椭圆拟合度(Eliptic Fit),主方向(Main direction),最大封闭椭圆半径(Radius of largest enclosed elipse),最小封闭椭圆半径(Radius of smallest enclosed elipse),矩形拟合度(Rectangular Fit),圆度(Roundness),形状指数(Shape index); 纹理信息方面:灰度共生矩阵均质度(GLCM Homogeneity),灰度共生矩阵对比度(GLCM Contrast),灰度共生矩阵不相似度(GLCM Dissimilarity),灰度共生矩阵熵(GLCM Entropy),灰度共生矩阵值(GLCM mean),灰度共生矩阵标准差(GLCM stdDev),灰度差分矢量对比度(GLDV Contrast),灰度差分矢量熵(GLDV Entropy),灰度差分矢量值(GLDV mean)等(王文宇,李博,2006)。
对特征进行输出,共有71个原始特征。通过特征相关系数矩阵阈值判定,对原特征矩阵进行优化,得到一个10 维的特征子集:1、2、3波段均值,亮度,形状指数,长宽比,1、2、3波段GLCM均值、混合差异值。利用类间距离和类内距离进行优化,得到一个5维的特征子集:3波段均值,形状指数,亮度,长宽比,2波段GLCM均值。原始无人机遥感影像以及最终得分类结果如图3所示。
根据1.3节所述原理,首先绘制与实验影像面积相同的20×20规则网格,然后在每个网格中随机生成10个随机点,最后通过目视解译获得每个随机验证点的土地利用类型。得到了共计有48个有效验证点。经过计算可得,本文方法分类的总体精度为87.5%,Kappa系数为0.835。具体结果如表2所示。
本文研究了一种基于改进SEaTH算法的芦山地震无人机遥感影像信息分类制图方法,取得了较为满意的分类结果。地震后获取的高分辨率遥感影像纹理、光谱特征丰富,改进的SEaTH算法在传统SEaTH算法的基础上引入了特征之间去相关处理,并综合考虑了类内距离与类间距离的共同影响,还构建了以类间距离为主、类内距离为辅的新的特征筛选指标,较大地提高了震区土地利用信息的分类效率和精度。为抗震救灾全面准确地掌握、评估灾情,进而为采取有效的救灾措施和灾后重建提供了可靠的空间数据支撑。还需进一步研究更好的特征优选去相关方法,还可研究地类信息提取顺序对分类精度的影响。