Object Detection of Remote Sensing Images

朝朝暮暮Quake

已于 2024-04-29 10:37:18 修改

阅读量57

点赞数

文章标签：目标检测人工智能计算机视觉

于 2024-04-17 20:40:21 首次发布

本文链接：https://blog.csdn.net/qq_43578042/article/details/137886967

版权

本文提出了一种名为MDCT的单阶段目标检测模型，针对遥感图像中复杂背景和密集场景下小物体检测的挑战。MDCT模型结合了多核扩张卷积（MDC）块和Transformer块，增强小目标特征并防止信息丢失。实验证明，MDCT在DIOR、DOTA和NWPU VHR-10数据集上相比YOLOv5有显著提升。

摘要由CSDN通过智能技术生成

原文链接：https://www.mdpi.com/2072-4292/15/2/371#
基于深度学习（DL）的目标检测算法在自然图像方面取得了令人瞩目的成就，并近年来逐渐成熟。然而，与自然图像相比，遥感图像由于背景复杂、密集场景中的小物体检测困难，面临着严峻的挑战。为了解决这些问题，基于多内核扩张卷积（MDC）块和变换器块，提出了一种名为 MDCT 的新型单阶段目标检测模型。首先，在一阶段目标检测模型中开发了一种新的特征增强模块MDC块，以增强小目标的本体和相邻空间特征。其次，我们将变压器块集成到一级目标检测模型的颈部网络中，以防止复杂背景和密集场景中目标信息的丢失。最后，在每个MDC块中引入深度可分离卷积以降低计算成本。我们在三个数据集上进行实验：DIOR、DOTA 和 NWPU VHR-10。与YOLOv5相比，我们的模型在DIOR、DOTA和NWPU VHR-10数据集上的目标检测精度分别提高了2.3%、0.9%和2.9%。
随着传感器制造技术的进步，许多专业级遥感卫星定期发射，使我们能够收集到大量的遥感数据。遥感图像（RSIs）具有图像覆盖面广、拍摄距离远的特点[1]。虽然 RSI 传达了各种对物体检测有用的特征和信息，但它们也提供了大量冗余数据，使得找到小物体变得更加困难。此外，物体的形状和角度是可变的，使得分析和处理长距离RSI变得更加困难。然而，与自然图像相比，RSI 由于其独特的性质，在目标检测方面面临许多挑战[2]。
RSI 通常包含许多小尺寸物体，这些物体在图像中占据较少的像素。由于卷积神经网络中逐层进行特征提取，一些中小尺寸的物体很难维持在最高层的特征图中。结果，模型无法收集足够的物体特征信息，因此在检测过程中很容易忽略