基于深度学习的遥感图像中地面塌陷识别方法研究

摘要:地面塌陷是在?_采矿产资源时出现的一种具有很强破坏力的自然灾害,会导致道路改线、道路污染、居民地及水系的改变,使矿区不能持续发展。

随着传感器技术、遥感技术等一系列技术的快速发展,极大地提升了遥感图像处理技术,特别是在地面塌陷识别方面尤为突出。

针对传统地面塌陷识别方法效率低下问题,提出了基于深度学习的地面塌陷遥感识别方法。

通过大量实验对比分类精度、Kappa系数调整深度信念网络模型的参数,得到适合地面塌陷识别的参数设置,证明了深度学习在遥感图像中地面塌陷识别方法的可行性和高效性,为今后地面塌陷识别方法提供了新思路。

毕业论文网   关键词:地面塌陷遥感影像深度学习;深度信念网络   中图分类号:TB文献标识码ki.16723198.2017.35.091   0引言   最近一些年,伴随着国民经济的快速发展,建设的力度加大,煤矿工业也进入了发展的快车道。

在采煤过程中出现的矿区沉降的现象非常普遍,因为它经常导致地面塌陷、裂缝、滑坡等一系列地质灾害。

为了防止地质灾害的发生,需要对煤矿区地面的沉降加大监测力度,特别是矿区塌陷地的状况已经成为矿区环境综合治理的最主要问题。

近些年以来遥感技术一直在快速发展,但在实际应用中获取遥感影像中的信息仍然十分困难,基于机器学习的遥感影像识别方法为这个难题的解决提供了可能。

2014年,高长鑫和桑农提出了一种分层的深度学习模型,并针对海量高分遥感影像数据进行识别

2015年,L. L. Wang等提出了一种用于选择遥感图像中最佳波段的最优索引因子方法,改善了遥感图像的空间信息以保持多光谱的特征。

同年,X. Li和G. Wang提出了一种改进差分演化算法,解决了高光谱数据最佳频段选择问题,改善了遥感数据的处理数度。

H. Zhang等以新疆有理罗布村典型不良地质现象为例,分别使用了极限学习机、支持向量机和K均值三种算法进行了遥感图像的分类识别

2016年,张浩等针对建筑物的遥感影像特征,提出了基于SVM的交叉验证的方法对参数敏感度进行了分析。

同年,陈冠宇等提出了基于特征融合的SVM算法,探讨了遥感影像中植被识别的方法。

安凯等对比了卷积神经网络、K均值、SVM算法和贝叶斯算法的分类精度,探讨了不良地质体识别分类的方法。

1深度学习基本模型   1.1受限玻尔兹曼机(Restricted Boltzmann Machine)   受限玻尔兹曼机(Restricted Boltzmann Machine,简称RBM)是一种玻尔兹曼机的变体,但限定模型必须为二部图。

假如我们有一个二部图,而且同一层节点之间无连接,其中一层是输入数据层v,另外一层为隐藏层h。

如图1所示,显示全部节点都为随机的二值变量(即只取0或者1),同时把全概率分布p(v,h)都看作满足玻尔兹曼分布,则此模型我们就称之为受限玻尔兹曼机(RBM)。

RBM因为隐藏节点间无连接,所以隐藏节点间条件独立。

故在已知v的情况下有p(h|v)=p(h1|v)=...=p(hn|v)。

此外,可视节点间也是独立的,故在已知隐藏层h的情况下有p(v1|h)=p(v2|h)=...=p(vn|h)。

同时又由于v和h满足玻尔兹曼分布,因而,在输入v的时候,经过p(h|v)运算能够获取隐藏层h,获得隐藏层h以后,经过p(v|h)运算又可以获得可视层。

不断训练参数,让隐藏层获得的v1与以前可视层v几乎毫无差别,此时的隐藏层可以认为是可视层的一种表现方式了。

1.2深度信念网络(Deep Belief Networks)   DBN这个网络模型是多层 RBM 构成的,其网络结构如图2所示。

训练过程:   (1) 起先充分训练第一个受限波尔兹曼机(RBM)。

(2) 然后我们把第一个 RBM 的权重以及偏移量固定住,再把它的隐性神经元的状态当作第二个 RBM 输入向量。

(3) 再让第二个 RBM得到足够的训练后,就把第二个 RBM 堆叠放在第一个 RBM 的上面。

(4)把以上三个步骤重复多次。

(5) 如果在训练集中出现的数据有标签,在训练顶层RBM的时候,这个 RBM 的显层中不光有显性神经元,还必须有代表分类标签的神经元,来一起训练:   ①假设顶层RBM的显层里面有400个显性神经元,我们把训练数据的分类总共分为10 类。

②这样顶层RBM的显层就会有410个显性神经元,对每一个训练数据,相应的标签神经元被打开就设为 1,其他的则被关闭设为0。

(6)DBN 被训练好好如图3所示。

2实验设计   2.1样本库的制作   在制作训练样本数据时以像元为单位,即一个像元为一个训练样本

先采用ENVI截取选取一张1000*1000大小的影像,如图4所示,这张影像中既要有塌陷区域,又要有非塌陷区域,这样能避免制作的训练样本正负标签差异太大。

由于待研究区域的遥感影像已经通过人工解译的方式得到塌陷区域分布情况,所以,可用程序读取原遥感影像文件和解译结果文件,将一个像元的三个波段的值和这个像元对应的类标签信息绑定在一起,这样就能在后续的变换操作中依然保持像元的RGB三个波段的值和像元的类标签对应,而不至于混乱。

具体操作步骤如下:   (1)读取1000*1000的3波段影像文件,得到1000*1000*3的矩阵,转化为1000000*3的矩阵Img,其中每一行都是一个像元。

(2)读取1000*1000的标定数据,得到1000*1000的矩阵,和影像文件的像元一一对应,这个矩阵的值只有1(塌陷区)和2(非塌陷区),同样将矩阵转化为1000000*2的矩阵Labels,每一行对应一个像元,第一列的值表示塌陷区,第二列为非塌陷区。

(3)将矩阵Img和矩阵Labels合并,组成新的矩阵Comb,这个矩阵的规模为1000000*5,每一行对应一个像元,前三列为该像元的三个波段的值,后两列有且只有一个为0和1,表示是否属于塌陷区域。

(4)将矩阵Comb的行顺序打乱,并按照样本是否属于塌陷区域,将矩阵分为正样本矩阵P和负样本矩阵N,由于负样本明显多余正样本,所以要删除一些负样本,由于顺序已经打乱,可以只保留负样本中排在前面的那部分样本N1,使得正负样本一样多,再将正样本P和保留下来的负样本N1合并为Comb1,再次按行打乱。

(5)将合并后的训练样本Comb1按像元和类标签拆分为n*3的像元属性矩阵train_x和n*2的类标签矩阵train_y,这样就得到带有标签的训练样本了。

最终得到的测试数据分为test_x和test_y两部分,将以上得到的train_x、train_y、test_x,test_y都保存到mnist_uint8.mat文件中,以备后续使用。

2.2评价标准   分类效果分析是分类实验必不可少的环节,比较分类效果之前必须制定评价标准。

总体分类精度、Kappa系数是常用的分析分类效果的手段。

本文实验也从这两个方面对地面塌陷识别效果进行评价。

(1)总体精度(OverallAccuracy, OA)是基本标准,是对分类结果的通体评价,总体精度的高低直接决定分类方法的可行性,一个分类方法的分类精度太低,就缺乏应用价值了。

总体精度等于被正确分类的像素总和除以总的像素个数。

计算公式如下:   pc=∑mi=1nijN(1)   其中,pc表示总体精度,nij表示第i类判别正确的样本数,m表示类别数,N表示样本总数。

(2)Kappa系数通过把所有地表真实分类中的像元总数(N)乘以混淆矩阵对角线(pij)的和,再减去某一类地表真实像元总数与被误分成该类像元总数之积对所有类别求和的结果,再除以总像元数的平方减去某一类中地表真实像元总数与该类中被分类像元总数之积对所有类别求和的结果所得到的。

Kappa系数的计算公式是:   k=N∑mi=1nij—∑mi=1(ni*n*j)N2—∑mi=1(ni*nxj)(2)   其中,ni*表示混淆矩阵第i行的和,n*j表示第j列的和。

研究认为,Kappa系数与分类精度的关系如表1所示。

2.3参数设置   2.3.1网络层数   之所以任意的非线性映射可以由神经网络实现,是因为任意神经网络中都存在隐含层。

隐含层的层数可以影响识别精度、误差大小、网络训练时间以及系统的复杂程度。

实验中,将设置不同的神经网络的层数对比分类效果。

2.3.2隐含层神经元个数   隐含层神经元??数的选择非常重要,如果神经元个数选择过少的话,不足以训练该神经网络,如果神经元个数过多的话,虽然可以提高识别精度,但是同样会使系统复杂化,训练时间也会非常的长,所以选择一个合理的神经元个数是非常重要的。

2.3.3学习速率的确定   在网络训练过程中,权值的改变量称作学习速率,其作用影响到分类器的训练时间、收敛时间和稳定性,故系统中设置过高或过低的学习速率是不妥的。

所以综上所述,实验中设置学习速率为不同的值,观察学习速率对识别效果的影响。

2.3.4迭代次数   根据Hinton的研究,设置batchsize大小为100,由于样本迭代20遍之后分类准确率趋于稳定,针对不同问题迭代次数对分类结果的影响可能不一样。

2.3.5样本数量   样本数量对网络模型的训练也起着极其重要的影响,样本数量多,覆盖的特征也越全面。

但是随着样本数量的增加,训练网络就需要更多的时间,因此训练样本并不是越多越好,包含特征量相同的情况下,样本数量越小越有优势。

3实验结果与分析   DBN作为深度学习模型,网络深度必然会对分类效果有很大的影响,层数更深的网络设置可以发掘出更为抽象的特征,但也可能导致过拟合现象。

实验设置网络(不包含输入层和输出层)从1层到10层时,总体分类精度、Kappa系数的变化情况。

实验中设置隐含层神经元个数为50,学习速率为0.01,迭代次数为3次,样本数量为10000个。

实验结果如图5、图6和图所示:   因为能力和时间有限,只对网络深度变化时的总体精度和Kappa系数的不同做了研究。

根据分类精度和Kappa系数随着网络深度变化的柱形图可以看出,网络深度在4——6时能较为准确的识别地面塌陷区域,分类精度最高为0.982,Kappa系数最高为0.9545,此时的网络深度为5。

所以本实验中设置隐含层为5的时候,总体分类效果比较好。

随机选取预处理之后的遥感影像上的3片1000*1000的区域进行分来效果测试,测试结果如图7、图8所示。

由图可知,深度信念网络与地面塌陷识别相结合,可以有效地进行遥感影像上的地面塌陷区域识别,选择合适的样本库,调整设置深度信念网络深度参数,可以得到较好的分类效果。

4结论   本文针对传统地面塌陷识别方法效率低下问题,提出了基于深度学习的地面塌陷遥感识别方法。

主要是将DBN应用于实际应用――遥感影像上的地面塌陷区域识别,从实验所需的样本库的建立,DBN应用于地面塌陷识别的效果评价标准,实验中DBN的网络层数设置对实验结果的影响,以及对结果进行了分析。

实验证明了DBN运用于地面塌陷识别的可行性,改善了传统地面塌陷判别方法效率低下和遥感影像监督分类和非监督分类存在的对专业知识或者数据本身特征的依赖性。

参考文献   [1]高常鑫,桑农.基于深度学习的高分辨率遥感影像目标检测[J].测绘通报,2014(增刊1):108111.   [2]X. Li and L. L. Wang. On the study of fusion techniques for bad geological remote sensing image[J].Journal of Ambient intelligence & Humanized Computing,2015,6(1):9941004.   [3]X. Li and G. Wang. Optimal band selection for hyperspectral data with improved differential evolution[J].Journal of Ambient Intelligence & Humanized Computing,2015,6(5):675688.   [4]X. Li and H. Zhang. Identification of remote sensing image of adverse geological body based on classification[C].Anon. Bio—inspired computing: Theories and applications. Berlin Heidelberg: Springer, 2015:232241.   [5]张浩,赵云胜,陈冠宇,等.基于支持向量机的遥感图像建筑物识别分类方法研究[J].地质科技情报,2016,35(6):194199.   [6]陈冠宇,李向,王岭玲.基于大数据的遥感图像植被识别方法[J].地质科技情报,2016,35(3): 205211.   [7]陈冠宇,安凯,李向.基于卷积神经网络的不良地质体识别分类[J].地质科技情报,2015,35(1):205211.   [8]刘庆玲.基于模糊深度学习网络算法的短期股价预测[D].哈尔滨:哈尔滨工业大学,2016.   [9]陈兴杰.基于GF—1号卫星影像的监督分类方法比较[J].矿山测量,2017,45 (3):1719.

2 次访问