【论文阅读】Concurrent Segmentation and Object Detection CNNs for Aircraft Detection and Identification

小李AI飞刀^_^

已于 2023-09-08 15:55:58 修改

阅读量1.2k

点赞数

分类专栏：文献阅读文章标签：目标检测计算机视觉人工智能

于 2021-12-26 10:02:58 首次发布

本文链接：https://blog.csdn.net/MLH7M/article/details/122106884

版权

9 篇文章 2 订阅

订阅专栏

这篇论文来自preligens，同时采用了分割和检测算法来实现遥感影像飞机的检测和识别，创造性的将分割和检测两类算法进行了融合，提高了检测识别的精度和效率。

一、引言

介绍背景、CNN的发展和作用、分割网络和检测网络的代表性类型；
本文中，作者试图找到一种高效且鲁棒的能够解决飞机检测识别问题的方法。因此，作者提出了一个基于不同CNN模型的混合方法：一个基于U-Net的分割网络，用于更高效的检测(better detection rate)；一个基于RetinaNet的检测模型，用于识别并提高精度(identifying and improving the precision)。

混合模型各部分选择的前提：（1）改变训练模式会引起模型内部特征提取方式的改变；（2）分割模型非常有效，但是在目标的分割和识别中效果较差；（3）在高分辨率的卫星影像中，飞机的尺寸是有限的。

分割网络实现的目标：（1）检测飞机（无需识别）；（2）获得高的recall（尤其是在位置信息上）；（3）鲁棒性强。

本研究的模型基于U-Net架构进行了部分改进：

检测网络实现的目标：（1）分离检测到的目标；（2）正确识别目标。

本研究的模型基于RetinaNet进行了部分改进：

此外，模型还结合了focal loss解决样本不平衡的问题。

分割模型提取的特征在定位方面表现优异，但难以分割或识别目标；

检测模型提取的特征在识别上效果很好，但是recall高precision低。

模型执行的步骤：

三级数据标签表示法：类型（飞机）——功能（轰炸机、运输机等）——类别（F-16、Tu-95等）。

分辨率30-50cm,切片512×512（128的重叠）。

分割模型采用的是类别加权交叉熵；

检测器训练时，采用focal loss进行分类，smooth L1 loss进行回归；

增加了分类的权重（回归权重的1.5倍），NMS的阈值为0.35；

两个模型都可以通过改变预测阈值(prediction threshold)和最小尺寸(minimum size)来进行recall和precision平衡模式的调整。

关注