每日阅读论文02---Mamba (VMamba) 系列

最新推荐文章于 2024-08-31 14:51:29 发布

DLst_liu

最新推荐文章于 2024-08-31 14:51:29 发布

阅读量797

点赞数 16

分类专栏：每日论文阅读文章标签：深度学习计算机视觉人工智能论文阅读

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_45022754/article/details/141232369

版权

每日论文阅读专栏收录该内容

2 篇文章 0 订阅

订阅专栏

今日分享三篇论文：利用VMamba的基础模块Visual State Space (VSS)来解决下游任务（分割和检测）。

目录

一、Mamba YOLO: SSMs-Based YOLO For Object Detection

1、Overall Architecture

二、RS^3Mamba: Visual State Space Model for Remote Sensing Image Semantic Segmentation

1、Overall Architecture

三、VM-UNet: Vision Mamba UNet for Medical Image Segmentation

1、Overall Architecture

一、Mamba YOLO: SSMs-Based YOLO For Object Detection

Published in: Arxiv

Contributions: Mamba-YOLO, ODSS Block

1、Overall Architecture

Backbone（特征提取）+PAFPN（不同特征尺度融合）+Head（检测）

2、ODSS Block

这个结构由三部分组成LocalSpatial (LS) 和2D Selective Scan (SS2D) 以及ResGated (RG) 三部分，整体的结构风格借鉴了Transformer block。

LocalSpatial Block：提取局部信息，但在Mamba结构中有一层卷积，正如该博客提到的，或许是因为局部提取能力不足。（注：对于Mamba不太了解的可以看看这个博客，感觉挺好的！！！）

SS2D：提取全局信息 (long-range dependencies)

ResGated Block：提高模型性能

二、RS^3Mamba: Visual State Space Model for Remote Sensing Image Semantic Segmentation

Published in: IEEE GEOSCIENCE AND REMOTE SENSING LETTERS

Contributions: RS^3Mamba, Collaborative Completion Module (CCM)

1、Overall Architecture

Encoder分为两个分支（主+辅），辅分支的VSS block提取全局特征，主分支的residual block采用Resnet18结构来提取局部特征，并通过CCM融合。Decoder采用UNetformer中的结构。

2、CCM

很容易可以看出，提取到的全局和局部特征再次进行特征提取，即 $F_m^i$ （这是辅Encoder提取到的全局特征）进一步通过Local Branch提取局部特征， $F_a^i$ 同理。

三、VM-UNet: Vision Mamba UNet for Medical Image Segmentation

Published in: Arxiv

Contributions: VM-UNet

1、Overall Architecture

跟上一篇一样都是Encoder和Decoder（U结构），引入VSS结构，验证其有效性。

四、总结

1、基本都是提取全局特征和局部特征，然后进行融合。

注：在CV领域，通道上的特征信息是否可以考虑！！！进行融合！！！（融合的策略如何考虑）

2、从实验结果上来看，好像确实比transformer性能要好。

关注

16
点赞
踩
25

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

DLst_liu CSDN认证博客专家 CSDN认证企业博客

码龄5年

合肥工业大学

8: 原创

22万+: 周排名

8万+: 总排名

4482: 访问

: 等级

180: 积分

135: 粉丝

99: 获赞

0: 评论

75: 收藏

私信

关注

热门文章

分类专栏

最新评论

每日论文阅读01
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。