Object Detection of Remote Sensing Images

本文提出了一种名为MDCT的单阶段目标检测模型,针对遥感图像中复杂背景和密集场景下小物体检测的挑战。MDCT模型结合了多核扩张卷积(MDC)块和Transformer块,增强小目标特征并防止信息丢失。实验证明,MDCT在DIOR、DOTA和NWPU VHR-10数据集上相比YOLOv5有显著提升。
摘要由CSDN通过智能技术生成

原文链接:https://www.mdpi.com/2072-4292/15/2/371#
基于深度学习(DL)的目标检测算法在自然图像方面取得了令人瞩目的成就,并近年来逐渐成熟。 然而,与自然图像相比,遥感图像由于背景复杂、密集场景中的小物体检测困难,面临着严峻的挑战。 为了解决这些问题,基于多内核扩张卷积(MDC)块和变换器块,提出了一种名为 MDCT 的新型单阶段目标检测模型。 首先,在一阶段目标检测模型中开发了一种新的特征增强模块MDC块,以增强小目标的本体和相邻空间特征。 其次,我们将变压器块集成到一级目标检测模型的颈部网络中,以防止复杂背景和密集场景中目标信息的丢失。 最后,在每个MDC块中引入深度可分离卷积以降低计算成本。 我们在三个数据集上进行实验:DIOR、DOTA 和 NWPU VHR-10。 与YOLOv5相比,我们的模型在DIOR、DOTA和NWPU VHR-10数据集上的目标检测精度分别提高了2.3%、0.9%和2.9%。
随着传感器制造技术的进步,许多专业级遥感卫星定期发射,使我们能够收集到大量的遥感数据。 遥感图像(RSIs)具有图像覆盖面广、拍摄距离远的特点[1]。 虽然 RSI 传达了各种对物体检测有用的特征和信息,但它们也提供了大量冗余数据,使得找到小物体变得更加困难。 此外,物体的形状和角度是可变的,使得分析和处理长距离RSI变得更加困难。 然而,与自然图像相比,RSI 由于其独特的性质,在目标检测方面面临许多挑战[2]。
RSI 通常包含许多小尺寸物体,这些物体在图像中占据较少的像素。 由于卷积神经网络中逐层进行特征提取,一些中小尺寸的物体很难维持在最高层的特征图中。 结果,模型无法收集足够的物体特征信息,因此在检测过程中很容易忽略

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值