小目标检测顶会新思路!最新成果刷爆遥感SOTA,参数小了18倍

遥感领域的小目标检测一直是个具有挑战性和趣味性的研究方向,同时也是顶会顶刊的常客。但不得不说,今年关于遥感小目标检测的研究热情尤其高涨,已经出现了很多非常优秀的成果。

比如SuperYOLO方法,通过融合多模态数据并执行高分辨率的目标检测,在大幅提高遥感图像中小目标的检测准确性和速度的同时,参数减少了18倍。

再比如结合顶流Mamba和YOLOv9的SOAR,在精度和效率方面都达到了SOTA,性能直接起飞,实力证明遥感小目标检测广泛的应用潜力和高精度的检测能力。

不过由于它的复杂性,遥感小目标检测还是有很多问题没有解决,但这也意味着还有不少创新空间等我们挖掘。为了方便大家找idea,我这边整理了9篇最新的遥感小目标检测论文,基本都有代码,强烈建议想发顶会的同学研读。

论文原文+开源代码需要的同学看文末

SuperYOLO: Super resolution assisted object detection in multimodal remote sensing imagery

方法:本文提出了一种名为SuperYOLO的准确且快速的遥感图像目标检测方法,通过融合多模态数据并利用辅助超分辨率学习实现对多尺度小目标的高分辨率检测,同时考虑检测准确性和计算成本,取得了优于现有模型的性能表现,具有较低的参数大小和计算代价。

创新点:

  • 通过引入一个简单而灵活的超分辨率(SR)分支,实现高分辨率(HR)特征表示的学习,从而能够在仅有低分辨率(LR)输入的情况下,轻松识别广阔背景中的小物体。

  • 提出了一种计算友好的像素级融合方法,以对称且紧凑的方式双向组合内部信息。与特征级融合相比,它在减少计算成本的同时不会损失准确性。

SOAR: Advancements in Small Body Object Detection for Aerial Imagery Using State Space Models and Programmable Gradients

方法:论文主要研究了在航空图像中小目标的检测,采用了SAHI框架结合YOLO v9和Vision Mamba模型,以及双向状态空间模型,有效解决了小目标被背景噪声遮挡的挑战,提高了检测精度和计算效率。

创新点:

  • 了在轻量级YOLO v9架构上使用SAHI框架,该框架利用可编程梯度信息来减少在顺序特征提取过程中通常遇到的巨大信息损失。

  • 采用了Vision Mamba模型,并结合了新颖的双向SSM进行有效的视觉上下文建模。这种模型结合了CNN的线性复杂度和Transformers的全局感受野,特别适用于遥感图像分类。

LR-FPN: Enhancing Remote Sensing Object Detection with Location Refined Feature Pyramid Network

方法:论文引入了一种新颖的位置细化特征金字塔网络(LR-FPN),增强了浅层位置信息的提取,并促进了细粒度上下文交互。LR-FPN通过浅层位置信息提取模块(SPIEM)和上下文交互模块(CIM),有效地利用了稳健的位置信息。

创新点:

  • 介绍了一种插拔式的位置精化特征金字塔网络(LR-FPN),以增强浅层位置信息的提取,并促进细粒度的上下文交互。

  • 引入了一个上下文交互模块(CIM),用于有效地处理空间和通道信息的交互。通过使用深度卷积和空洞深度卷积进行通道内的本地空间信息交互,并通过空洞深度卷积来处理非局部空间交互的挑战,有效地扩大了感受野并增强了空间信息的非局部交互。

HCF-Net: Hierarchical Context Fusion Network for Infrared Small Object Detection

方法:论文提出了一种名为HCF-Net的深度学习方法,通过多个实用模块显著提高了红外小目标检测性能。该方法包括并行化的自适应注意力模块(PPA)、维度感知选择融合模块(DASI)和多膨胀通道细化模块(MDCR)。

创新点:

  • 提出了HCF-Net,这是一种从头开始训练的、层次化的上下文融合网络,用于红外小目标检测。通过多个实用模块,HCF-Net显著提高了红外小目标检测性能。

  • HCF-Net中的模块包括并行化的区域感知注意力模块(PPA)、维度感知的选择性融合模块(DASI)和多倍扩张通道细化器模块(MDCR)。这些模块通过不同的策略和技术选择,有效地解决了红外小目标检测中的困难和挑战。

关注下方《学姐带你玩AI》🚀🚀🚀

回复“遥感小目标”获取全部论文+开源代码

码字不易,欢迎大家点赞评论收藏

### 遥感图像目标检测领域最新SOTA数据集 #### DIOR 数据集 DIOR 是一个大规模的基准数据集,由23463幅800×800像素的遥感卫星图像和192,518个用水平边界框标注的物体实例组成,空间分辨率为0.5米至30米。该数据集涵盖了多种场景下的20类目标,包括但不限于飞机、机场、棒球场、篮球场、油罐等[^3]。 #### DOTA 数据集 DOTA (Dataset for Object Detection in Aerial Images) 是另一个广泛用于遥感图像目标检测的数据集。它包含了15种类别超过18万个实例,覆盖了各种复杂环境下的航空影像。与传统的矩形边框不同的是,DOTA采用了任意方向上的四边形或多边形来更精确地标记倾斜或旋转的对象。这使得模型能够更好地适应现实世界中变化多端的姿态情况[^4]。 #### HRSC2016 数据集 HRSC2016专注于高分辨率海事船只监测任务,提供了大量高质量的船舰样本图片以及详细的标签信息。此集合特别适合研究者们探索如何处理水面上的小型移动体这一挑战性课题。尽管规模相对较小,但在特定应用场景下仍具有重要价值。 #### SAR-Ship 数据集 针对合成孔径雷达(SAR)成像特点设计而成的一个专门面向海上交通监控的任务型数据库——SAR-Ship Dataset。其特色在于不仅限于可见光波段,而是利用全天候工作的微波传感器获取资料,从而增强了系统的鲁棒性和实用性。这对于军事侦察、灾难救援等领域尤为重要。 ```python import os from PIL import Image import matplotlib.pyplot as plt def display_sample_images(dataset_path): """展示来自指定路径的数据集中的一些样例图片""" fig = plt.figure(figsize=(10, 7)) rows = 2 columns = 3 image_files = [f for f in os.listdir(dataset_path) if f.endswith('.jpg') or f.endswith('.png')] for i in range(1, rows * columns + 1): img = Image.open(os.path.join(dataset_path, image_files[i])) ax = fig.add_subplot(rows, columns, i) ax.set_title(f"Image {i}") plt.imshow(img) display_sample_images("/path/to/dataset") # 替换为实际数据集路径 ```
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值