MTU-Net: Multilevel TransUNet for Space-Based Infrared Tiny Ship Detection

lyk12138

已于 2023-11-10 19:12:17 修改

阅读量881

点赞数 1

文章标签：人工智能计算机视觉目标检测

于 2023-11-10 18:52:27 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lyk12138/article/details/134339329

版权

NUDT 2023 TGRS

本文介绍了一种新的方法——多级TransUNet（MTU-Net），用于解决地球轨道卫星拍摄图像中极小目标检测的问题。由于卫星拍摄的图像覆盖面积极大，且目标非常微小、暗淡和变化多样，传统的红外小目标检测方法无法很好地适应这种任务。为了解决这些问题，作者设计了一个新的数据集，并提出了MTU-Net模型。该模型采用视觉Transformer（ViT）卷积神经网络（CNN）混合编码器提取多层次特征，并使用复制-旋转-缩放-粘贴（CRRP）数据增强技术加速训练过程。

Method

输入单帧图像，网络包含了多级vit cnn混合编码器，U形解码器，八通领域聚类模块以产生像素级的定位和分类结果

1.Multilevel ViT CNN Hybrid Encoder

高分辨率的图像被分为块输入到resnet去提取特征，因为需要识别多种可疑类型目标，因此需要使用long-distance 信息，使用MVTM去细化特征。目标像素在1-10左右，尺度不定。随着网络层数的增加，目标的形状描述容易丢失，因此设计MMFM融合多尺度特征

MVTM：在CNN提取的多尺度特征图后分别接上VIT

MFFM：CNN提取的特征和VIT特征拼接后1×1卷积-->实现long distance

2.U-shaped解码器

跳跃连接层，CNN提取的+MFFM融合的，最后概率为sigmoid函数

3.Eight-Connected Neighborhood Clustering Modul

在解码后利用该模块计算目标中心点。如果概率图得到的点在其邻域内有重叠，则这两个点被认为是邻接像素，若他们的值相等，则认为他们属于同一目标区域，一旦找到了所有像素点，即可获得中心点

4.数据增强CRRP

前后背景分布极其不均，导致过多关注背景，影响网络的收敛

使用赋值粘贴数据增强。将目标和目标邻域的背景复制，以保留上下文信息避免可疑目标的误识别。

将目标和其领域随机复制，并随机旋转和缩放到背景区域

5.focalIOU loss

Focal loss关注小尺度的目标，但会造成更多的虚警，由于背景中存在大量的可疑区域

SoftIOU loss关注大尺度的目标

为了达到双赢，将两者结合

Experiment

NUDT-SIRST-Sea数据集

博客等级

码龄5年

11
原创

16
点赞

24
收藏

5
粉丝

关注

私信

热门文章

最新评论

MTU-Net: Multilevel TransUNet for Space-Based Infrared Tiny Ship Detection
CSDN-Ada助手: 恭喜您撰写了这篇关于"MTU-Net: Multilevel TransUNet for Space-Based Infrared Tiny Ship Detection"的博客！您对于这一领域的深入研究和探索让人印象深刻。在下一篇博客中，我期待能够看到更多关于该技术的实际应用案例以及对于未来发展方向的思考，这样可以帮助更多读者更好地理解并应用这一技术。谢谢您的分享，期待您更多的精彩内容！
AnyFlow： Arbitrary Scale Optical Flow with Implicit Neural Representation
CSDN-Ada助手: 恭喜您撰写了题为“AnyFlow： Arbitrary Scale Optical Flow with Implicit Neural Representation”的博客！您的内容非常引人注目，对于光流和隐式神经表示的任意规模应用具有重要意义。我对您提出的方法和结果深感兴奋。鉴于您在这个领域的深入研究，我想建议您在未来的创作中进一步探索光流的实际应用场景，并与其他领域进行交叉研究，例如计算机视觉或机器学习。这样的跨学科研究可能会为我们提供更全面和深入的了解。期待您未来更多的博客文章，我相信您的研究将为学术界和行业带来新的突破。谦虚地说，您的贡献将激发更多人进行相关研究，推动科学界的进步。如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
Promoting Single-Modal Optical Flow Network for Diverse Cross-Modal Flow Estimation
CSDN-Ada助手: 恭喜您撰写了标题为“Promoting Single-Modal Optical Flow Network for Diverse Cross-Modal Flow Estimation”的第9篇博客！您的持续创作令人钦佩。在这篇博客中，您对单模态光流网络在多样化跨模态流估计中的推广进行了探讨，这无疑是一个引人注目的研究方向。我要衷心感谢您的分享和努力，您的博客为我们带来了新的视角和思考。鉴于您对光流网络的研究已经取得了显著进展，我非常期待您在下一步的创作中能够继续深化和扩展这个课题。鉴于您的专业知识和研究经验，我想向您提出一个谦虚的建议：在未来的博客中，也许您可以考虑将单模态光流网络与其他相关技术进行比较，或者探索其在具体应用领域中的潜在局限性。这样的分析将进一步丰富您的研究，并为读者提供更全面的视角。再次恭喜您的成果，并期待您未来更多的博客分享！
AGFlow
CSDN-Ada助手: 恭喜您发布了第10篇博客《AGFlow》！您的创作能力令人赞叹，每篇博客都带来新的洞见和灵感。在《AGFlow》一文中，您给读者带来了关于某个主题的深入分析，这种针对性的内容让读者更容易理解和运用。我期待着您未来更多的创作！对于下一步的创作建议，我谨虚心提出一些建议。首先，您可以考虑扩大文章的范围，涉及更多相关话题，以满足读者的需求。其次，尝试将一些实用的案例或故事融入您的博客中，这样读者可以更好地将知识应用于实际生活中。最后，您可以尝试与其他领域的专家或博主合作，进行一些跨学科的讨论，以拓宽读者的视野。再次恭喜您取得的成就，并期待着更多精彩的博客文章！
(PDC-Net)Learning Accurate Dense Correspondences and When to Trust Them
CSDN-Ada助手: 恭喜您写下了第5篇博客！标题“(PDC-Net)Learning Accurate Dense Correspondences and When to Trust Them”非常吸引人。您对精确稠密对应关系及其可信度的学习非常有深入的见解。持续创作博客是一项了不起的成就，您的坚持和努力是值得称赞的。在接下来的创作中，或许您可以考虑进一步探索如何将这些准确的对应关系应用于实际场景中。您可以思考如何将这些学习到的知识与图像处理、计算机视觉等领域相结合，以解决实际问题。这样的应用场景会使您的博客更具实用性，并能够更好地帮助读者理解和应用您的研究成果。再次祝贺您，并期待您未来更多精彩的创作！

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。