为什么要看这篇
这篇运用了四个数据集,包括本文提出的一个新的数据集RSISOD
注意:代码地址只提供了数据集,没有提供本文的模型代码
基本信息
期刊 | IEEE TRANSACTIONS ON GEOSCIENCE AND REMOTE SENSING |
---|---|
年份 | 2023 |
论文地址 | https://ieeexplore.ieee.org/abstract/document/10078913 |
代码地址 | https://github.com/QingpingZheng/RSISOD |
标题
基于两阶段部分解码器的遥感图像显著目标检测边界感知网络
目前存在的问题
- RSIs覆盖了更多样化的场景模式、更复杂的背景和更多样化的噪声干扰。此外,光学RSIs的显著目标具有较大的尺度和方向变化。因此,直接将现有的SOD模型(在自然图像场景中训练)移植到光学RSIs中并不能达到最优性能
- 在RSIs中对SOD的最大挑战是采集到的图像不可避免地存在尺度变异性和空间分辨率低的问题
- 现有的DAFNet虽然在光学RSIs的SOD上取得了令人满意的性能,但仍存在表面粗糙和空间结构不完整(孔径问题)两方面的缺点
改进
- 我们提出的BANet包括一个部分边界感知的解码器(BAD)、一个边界引导的特征增强(BGFE)模块和一个结构感知的部分解码器(SAD)。为了获得边界清晰的显著目标,引入边缘感知的二值骰子损失来引导BAD分支的学习,解决了光学RSIs中前景和背景之间严重的像素不平衡问题。然后依次采用得到的特征来细化第一级的高级特征,因为在BAD网络中使用下采样操作可能可以过滤掉小显著目标的边界。为了进一步获得结构完整的突出对象,我们设计了另一个结构感知的丢失函数来监督SAD分支的学习。因此,我们提出的BANet可以生成高质量的、边界清晰、结构完整的显著目标,同时降低了计算成本
- 提出了一个新的数据集RSISOD
- 现有的基于深度学习的光学RSIs SOD模型大多是在传统的编解码器架构的基础上开发的,该架构将所有被编码的低水平和高水平特征以分层的方式聚合到解码器模块中。然而,这些模型花费了大量的计算开销。为了缓解这一问题,我们提出了一种BANet,它只将高级特性聚合到解码器中。与传统的编码-解码器网络相比,该BANet由于去掉了底层特征而降低了计算复杂度,具体来说较浅层的特性{f1, f2}包含很多细节,但对最终性能的贡献较小。此外,底层特征具有较大的分辨率,导致较高的计算成本。与低级特征相比,高级特征{f3, f4, f5}对密集预测任务的最终结果贡献了更多的信息
网络结构
两个解码器,用VGG最后三层进行解码
损失函数
比较复杂
训练
使用ORSSD,EORSSD,ORSI4199,RSISOD这四个数据集进行训练
,100个epoch的adam优化器进行优化,学习率初始为1e-4,当训练损失趋于平缓时,学习率下降10%,数据增强采用与DAFNet相同的方法,本文没有使用任何后处理过程如CRF
测试
使用ORSSD,EORSSD,ORSI4199,RSISOD这四个数据集进行测试
我的总结
这篇论文首先提出了一个新的遥感显著性物体检测的数据集RSISOD,在网络部分其创新点是使用两个解码器,第一个解码器用来构建边缘特征,第二个解码器构建结构特征,并且是解码器用的vgg编码器的后三层,也就是用深层的语义信息而不用浅层的细节信息,作者认为浅层信息的贡献很少,并且计算量很大,因此舍弃不用