2020.01
武汉大学
论文下载地址:https://sci-hub.st/10.1007/s10346-020-01353-2
目录
使用注意力增强卷积神经网络从开放的卫星图像和数字高程模型数据集检测滑坡
Convolutional neural network(略去)
Landslide detection from an open satellite imagery and digital elevation model dataset using attention boosted convolutional neural networks
使用注意力增强卷积神经网络从开放的卫星图像和数字高程模型数据集检测滑坡
摘要:
卷积神经网络(Convolution neural network, CNN)是一种有效且流行的深度学习方法,它通过一系列卷积层自动学习从原始输入到给定标签或ground truth的复杂非线性映射。本研究的重点是利用基于cnn的方法从高分辨率光学卫星图像中检测滑坡,为识别潜在滑坡提供机会,并以高精度和时间效率更新大规模滑坡清单。针对滑坡的多样性和复杂背景,开发了源于人类视觉系统的注意机制,用于增强CNN从背景中提取更有特色的滑坡特征表征。由于深度学习需要大量的标记数据来训练一个学习模型,我们手工制作了一个位于中国毕节市的滑坡数据集。在数据集中,地质学者利用卫星图像和数字高程模型(digital elevation model, DEM)数据对770个滑坡进行了解释,并进一步通过野外工作进行了验证,其中包括岩崩、岩崩和少量岩屑滑坡。将滑坡数据以2:1的比例分成训练训练CNN模型的训练集和评估模型性能的测试集。试验结果表明,滑坡检测的最佳f1得分为96.62%。结果还证明,我们的空间通道注意机制的表现是相当高于其他最近的注意机制。此外,还证明了基于我们的数据集高效预测新的潜在滑坡的有效性。
Introduction
滑坡检测的必要性;实地考察费时费力;基于InSAR or satellite InSAR数据的自动化检测方法相继被提出。最近光学影像也引起关注。数字高程模型数据提供地形信息,在滑坡预测和识别中发挥重要作用。
将滑坡检测视为一个图像处理问题,数理统计和机器学习的方法被广泛应用。
SVM,RF,ANN…CNN
对于这些监督的机器/深度学习方法,需要高质量的带标签的滑坡数据作为训练和测试集,这样滑坡的显著性特征可以被自动学习到。因此构建带标签的遥感滑坡影像数据集至关重要。至今也没有公开的数据集。
CNN的特征提取能力超越了经验特征设计方法;在图像分类,目标检测,语义分割领域广泛应用。但基于CNN的滑坡检测的方法却刚刚起步。(介绍了一些论文。)都是比较浅层的网络。因此应该设计更复杂和具体的CNN架构,以提取滑坡区域在复杂背景下的独特表现。
考虑到开放数据集的缺乏以及从遥感数据中检测滑坡的高级算法的需求,我们在本文中做出了两个主要贡献:
- 我们设计了一个新颖的注意模块,生成三维空间和通道注意特征图,以强调复杂背景下不同滑坡实例的独特特征。注意力模块被整合到最先进的CNN结构中。滑坡检测中的注意模块大大加强了这些结构。我们的算法在实验上优于基线网络和由其他近期注意力机制推动的网络。
- 我们创建了一个开放、准确、大型的滑坡数据集,包括滑坡/非滑坡图像、滑坡边界的shapefiles和相应的DEM数据,可访问http://study.rsgis.whu.edu.cn/pages/download/。这是第一个经过仔细的三重检查的开放的滑坡遥感数据集。我们认为,这将推动光学遥感影像滑坡自动检测的研究
Related work
介绍了CNN: AlexNet,VGGNet,Inception,ResNet,DenseNet,WideResNet,ResNeXt,Xception
light-weight networks:SqueezeNet,MobileNet,适应实时的应用。
发展方向:wider,deeper,transforms,降低计算复杂度,减少参数量。
在本研究中,我们在这些经典网络的基础上开发了我们的attention模块,并选择最佳的一个用于滑坡检测。
介绍注意力机制,在CNN上应用注意力机制可以加强前景的特征。注意模块从CNN中提取特征图,通过突出前景,输出正则化特征图。
介绍了许多集成注意力的模块。
在这项工作中,我们开发了我们的3D注意模块,它在注意力图的推断阶段同时提取综合的空间和通道信息,这不同于上述分别处理空间和通道的注意模块。在滑坡检测任务中,与先进的SE、BAM和CBAM模块相比,我们的注意力模块获得了最好的性能。
研究区域覆盖毕节市全境,面积26853平方公里,位于中国贵州省西北部(图1)。该区地处青藏高原向东丘陵过渡地带,海拔457~2900m,地质不稳定,山坡多,雨量充沛(年平均降雨量849~1399mm),脆弱的生态环境使该地区成为我国滑坡最严重的地区之一。毕节市滑坡类型主要有崩塌岩滑和少量泥石流。每年都会发生许多新的山体滑坡,其中一些可能对人类住区、道路、桥梁、输电线路和农田造成毁灭性的破坏。目前,这里的滑坡主要是通过两种方法或两种方法的结合来发现的。一种是通过卫星/航空光学图像和数字高程模型(DEM)进行室内人工判读,然后通常进行精确的实地测量。也通过居民的汇报,进行测量。
根据图像目视解译缺少效率,并且需要额外的地理学知识。实地考察具有危险性并且浪费时间。报告通常是滞后的。对于滑坡的早期预警、风险评估和灾后恢复,特别是在紧急情况下,对自动化、高效、可靠的滑坡检测方法有着强烈的需求。
创建了一个数据集;数据介绍;
滑坡的边缘标记是由中国地质灾害防治与地质环境保护国家重点实验室的专家进行的。
从图像中看不出来的滑坡,删掉了。(只能通过实地考察看出来。)因为它会迷惑CNN模型。
一些地质滑坡形态特征明显的地区被标记为新的潜在滑坡。
Convolutional neural network(略去)
介绍了CNN原理;多种CNN结构;
Attention mechanisms
基于CNN的注意机制可以看作是自适应模块,它强调输入特征图的某些部分,抑制主干CNN中的其他部分。在图像分类任务中,注意力模块的设计是为了突出前景,抵抗噪声背景。
介绍了三个受欢迎的attention模块。three popular attention modules
(1)The squeeze-and-excitation (SE) module
关注给定输入特征图的通道间关系。
global average pooling (AvgPool) + MLP
(2)The bottleneck attention module (BAM)
分别利用渠道通道和空间注意机制。
channel attention:依次应用全局AvgPool、MLP和BN层生成通道注意图
spatial attention branch:BAM中的空间注意分支生成空间注意图,帮助网络发现特征图应该关注的位置。通过四次卷积运算和一次BN运算得到空间注意图。
(3)The convolutional block attention module (CBAM)
利用空间子模块和信道注意子模块来发现特征图中哪些位置和信道需要加强或抑制。
在channel attention子模块中,使用全局平均池(AvgPool)和全局最大池(MaxPool)对空间信息进行聚合,然后使用权重共享的MLP,再使用元素求和和sigmoid激活函数。
对于空间注意子模块,采用了沿通道轴的全局平均pooling和全局最大pooling;将它们的输出拼接起来,再通过卷积核大小为7x7的卷积层和sigmoid;
依次对CBAM的通道注意子模块和空间注意子模块进行细化。
本文提出的spatial and channel attention module (3D SCAM) ,与上面方法不同。
我们生成了一个整合(integrated)的空间和通道注意图,而不是分别处理一个通道和一个空间注意图;后者无法达到通道与空间的全局一致性。
Input feature map à global poolingàspatial ,channel descriptoràConv Block
设计一个Conv Block: 细化空间-通道依赖关系。
实现的时候,对输入特征图分别做了global ave pooling,global max pooling,再分别输入到两个Conv Block中(不共享权重),最终两个输出按元素求和,并被sigmoid激活,生成最后的3D空间-通道注意力图。(还挺复杂的。)
我们将我们的3D注意力模块放在resnet风格的网络的最后一个残块的隐藏层中。
Experiments and analysis
实验设置,评价指标;
在DEM数据辅助进行下的滑坡检测;
不同网络结构的比较;
不同注意力机制方法的比较;
不同pooling方法比较;reduction ratio比较;注意力模块放的位置比较。
Setting
Train_test: 2:1
A Linux PC with a GeForce GTX 1080 TI 11G GPU and an Intel i5-8400 CPU
所有模型用ImageNet数据预训练60 epoch,batchsize32。
数据处理,增强。
The network outputs the probability of an image/DEM belonging to a landslide, and a threshold of 0.5 was adopted.
评价指标:precision, recall, accuracy, and F1-score
分别用vgg-16和resnet-50探索了引入DEM数据后的表现,如下表所示:
实验表明,引入DEM数据后,性能都有相对的提高,但是只用DEM数据,结果就差的很多,这表明在滑坡检测中光学图像占据主要地位。DEM中的地形信息(高程、坡度、坡向)可以作为光学图像中一些混乱的纹理和形状(会导致预测误差)的补充信息。接下来的实验中,we use the combination of RGB images and DEM data as input.
选取了很多主流的CNN模型,进行实验。结果表明ResNet结构与其他结构相比具有一定的整体优势。
因此接下来以ResNet进行注意力机制的对比实验。(3D SCAM ours)
ResNet 18, ResNet 50, ResNet 101.
实验结果表明,所有模型上:1. 加注意力机制的模型都比baseline好。2.我们的3D SCAM在所有模型上,表现最好。
还进行了注意力可视化,通过heat map看出我们的方法能覆盖更精确的滑坡区域,表明我们的方法对各种背景的干扰具有较好的鲁棒性。
Conv Block 中 不同reduction ratio比较
注意力模块放的位置比较:ResNet 最后一个残差块隐藏层后(这种性能好),还是Output特征图之后。
Conclusion
创建了一个大型滑坡检测数据集,0.8m的卫星图像分辨率,划定了滑坡边界, 高精度DEM(2m)。
提出先进的3D空间-通道注意力机制。(3D SCAM)
做了大量的对比试验进行调参。