【论文阅读】Concurrent Segmentation and Object Detection CNNs for Aircraft Detection and Identification

这篇论文来自preligens,同时采用了分割和检测算法来实现遥感影像飞机的检测和识别,创造性的将分割和检测两类算法进行了融合,提高了检测识别的精度和效率。

一、引言

  • 介绍背景、CNN的发展和作用、分割网络和检测网络的代表性类型;
  • 本文中,作者试图找到一种高效且鲁棒的能够解决飞机检测识别问题的方法。因此,作者提出了一个基于不同CNN模型的混合方法:一个基于U-Net的分割网络,用于更高效的检测(better detection rate);一个基于RetinaNet的检测模型,用于识别并提高精度(identifying and improving the precision)。

二、方法

混合模型各部分选择的前提:(1)改变训练模式会引起模型内部特征提取方式的改变;(2)分割模型非常有效,但是在目标的分割和识别中效果较差;(3)在高分辨率的卫星影像中,飞机的尺寸是有限的。

1. 分割的CNN网络

分割网络实现的目标:(1)检测飞机(无需识别);(2)获得高的recall(尤其是在位置信息上);(3)鲁棒性强。

本研究的模型基于U-Net架构进行了部分改进:

  • 卷积层被替换为残差结构
  • 最大池化层用步长为2的卷积层代替
  • 网络的宽度和深度根据应用场景设定。

2. 检测的CNN网络

检测网络实现的目标:(1)分离检测到的目标;(2)正确识别目标。

本研究的模型基于RetinaNet进行了部分改进:

  • 在特征金字塔上增加了一层,以检测小目标;
  • RetinaNet提取特征的骨干网络为ResNet101;
  • 采用NMS移除多余的边界框。

此外,模型还结合了focal loss解决样本不平衡的问题。

3. 网络融合

分割模型提取的特征在定位方面表现优异,但难以分割或识别目标;

检测模型提取的特征在识别上效果很好,但是recall高precision低。

模型执行的步骤:

  • 采用分割模型提取影像中每个像元的预测值。这是定位的过程。
  • 将目标检测器应用在定位获得的正值区域。考虑到目标检测模型的位移不变性,这个过程是可迭代的:(1)应用检测模型;(2)从分割图中移除检测到的目标。
  • (可选) 研究预测图中剩余的正值区域以提高recall;考虑到被检测飞机的大小或距离,将目标添加到检测列表中。

三、 实验

1. 数据信息

三级数据标签表示法:类型(飞机)——功能(轰炸机、运输机等)——类别(F-16、Tu-95等)。

分辨率30-50cm,切片512×512(128的重叠)。

2. 模型参数信息

分割模型采用的是类别加权交叉熵;

检测器训练时,采用focal loss进行分类,smooth L1 loss进行回归;

增加了分类的权重(回归权重的1.5倍),NMS的阈值为0.35;

两个模型都可以通过改变预测阈值(prediction threshold)和最小尺寸(minimum size)来进行recall和precision平衡模式的调整。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

小李AI飞刀^_^

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值