论文阅读：Polyp-PVT: Polyp Segmentation with PyramidVision Transformers

最新推荐文章于 2024-07-24 20:06:37 发布

蓝海渔夫

最新推荐文章于 2024-07-24 20:06:37 发布

阅读量764

点赞数 7

分类专栏：深度学习文章标签：论文阅读人工智能深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/wwimhere/article/details/136668833

版权

深度学习专栏收录该内容

26 篇文章 1 订阅

订阅专栏

这篇论文提出了一种名为Polyp-PVT的新型息肉分割框架，该框架采用金字塔视觉变换器（Pyramid Vision Transformer, PVT）作为编码器，以显式提取更强大的特征。本模型中使用到的关键技术有三个：渐进式特征融合、通道和空间注意力、自注意力。

1，模型整体结构

Polyp-PVT通过引入三个简单的组件——级联融合模块（Cascaded Fusion Module, CFM）、伪装识别模块（Camouflage Identification Module, CIM）和相似性聚合模块（Similarity Aggregation Module, SAM），有效地提取了高级和低级线索，并将它们有效地融合以输出最终结果。这些模块有助于从不同维度捕获息肉的细节信息，包括纹理、颜色和边缘，并通过全局注意力机制将详细的外观特征注入到高级语义特征中。

2，编码器

作为模型的骨干网络，PVT用于从输入图像中提取多尺度长距离依赖特征。PVT采用金字塔结构，通过空间缩减注意力操作计算其表示，从而减少资源消耗。

3，CFM

CFM用于收集高级特征中的语义线索，并通过渐进式集成来定位息肉。它由两个级联部分组成，通过一系列的卷积单元和Hadamard乘积操作，将不同层次的特征图进行融合，生成一个特征图T1。

4，CIM

CIM旨在从低级特征图中捕获息肉的细节信息，如纹理、颜色和边缘。CIM包含通道注意力和空间注意力操作，通过这些注意力机制，可以从大量冗余信息中识别出息肉的细节和边缘信息。

5，SAM

SAM通过全局自注意力机制将T1和T2的特征图进行融合，有效地将像素级息肉区域的特征与整个息肉区域的高级语义位置信息结合起来。

SAM具体结构如下

其中T1（包含高级语义信息）和T2（包含丰富的外观细节，如纹理和边缘信息）是两个输入特征。

W是线性映射。

AP代表的是自适应池化（Adaptive Pooling）操作。自适应池化是一种操作，它根据输入特征图的尺寸动态调整池化区域的大小，以便在不同分辨率的输入特征图上保持一致的输出尺寸。

GCN是图卷积层，GCN通常用于捕捉图像中不同区域之间的复杂关系和结构信息。

6，实验结果

关注

7
点赞
踩
8

收藏

觉得还不错? 一键收藏
打赏
2
评论
论文阅读：Polyp-PVT: Polyp Segmentation with PyramidVision Transformers

这篇论文提出了一种名为Polyp-PVT的新型息肉分割框架，该框架采用金字塔视觉变换器（Pyramid Vision Transformer, PVT）作为编码器，以显式提取更强大的特征。本模型中使用到的关键技术有三个：渐进式特征融合、通道和空间注意力、自注意力。
复制链接

扫一扫

专栏目录

蓝海渔夫 CSDN认证博客专家 CSDN认证企业博客

码龄12年

51: 原创

4800: 周排名

2万+: 总排名

4万+: 访问

: 等级

1188: 积分

1931: 粉丝

623: 获赞

51: 评论

479: 收藏

私信

关注

热门文章

分类专栏

最新评论

如何用pytorch调用预训练Swin Transformer中的一个Swin block模块
qq_34978209: hello，我调用torchvision.model.swin_transformer显示没有这个模块呢？不知道是不是版本的问题，可以告诉我你的torchvision是什么版本的吗？
论文阅读U-KAN Makes Strong Backbone for MedicalImage Segmentation and Generation
壹晴天: 论文的ukan结构图好像和代码不一致
pytorch实现分割模型TransUNet
困困涵: 老师您好～想问一下您这个代码如何导入预训练权重呀
论文阅读：自适应ViT(A-ViT)
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
论文阅读：基于谱分析的全新早停策略
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。

最新文章

2024

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

蓝海渔夫 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。