【论文阅读】SegNeXt：重新思考卷积注意力设计

Deeeep Learning

已于 2024-08-15 19:40:26 修改

阅读量241

点赞数 8

分类专栏：图像分割文章标签：论文阅读计算机视觉

于 2024-08-15 18:35:16 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44037500/article/details/141228790

版权

图像分割专栏收录该内容

6 篇文章 0 订阅

订阅专栏

《SegNeXt: Rethinking Convolutional Attention Design for Semantic Segmentation》
原文：https://github.com/Visual-Attention-Network/SegNeXt/blob/main/resources/paper.pdf
源码：https://github.com/Visual-Attention-Network/SegNeXt

1、简介

提出了SegNeXt用于语义分割的简单卷积网络架构，核心是一种比transformer的自注意力更有效的编码方式进行上下文信息的编码，专注分割性能改进的几个组件，设计出了这种新型卷积注意力网络，性能有不小的提升。

2、网络

编码器

CNN中编码器常采用金字塔结构，作者提出了一种类似ViT但是没有自注意力机制的结构，设计了一种多尺度卷积注意模块（MSCA）。MSCA模块中包括：
1、深度卷积：用于聚合局部信息
2、多分支深度条带卷积：用于捕获多尺度上下文信息
3、1*1卷积：建模不同通道之间的关系
在这里插入图片描述

解码器

研究了三种简单的解码器结构，a表示SegFormer中的基于MLP的结构；b是直接将编码器的输出作为解码器的输入，比如ASPP、PSP和DANet等；c是作者采用的结构，聚合了最后三层的特征，并使用轻量级模块建模全局上下文。与SegFormer（聚合第一到第四阶段的特征）不同，作者只在解码器聚合了最后三个层的特征，主要原因是第一阶段的特征包含过多低级特征影像模型性能。下面作者证明SegNeXt优于基于Transformer的SegFormer和HRFormer。
在这里插入图片描述

部分实验结果

遥感数据集iSAID
在这里插入图片描述
模型参数量及计算量

Deeeep Learning

关注

8
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Deeeep Learning CSDN认证博客专家 CSDN认证企业博客

码龄6年

35: 原创

1万+: 周排名

4万+: 总排名

2万+: 访问

: 等级

693: 积分

331: 粉丝

328: 获赞

3: 评论

229: 收藏

私信

关注

热门文章

分类专栏

最新评论

【论文阅读】SegNeXt：重新思考卷积注意力设计
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
【论文阅读】BIR-Net：一种轻量级、高效的双支联合道路提取网络
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
【论文阅读】HBSeNet：一种用于遥感图像精确语义分割的混合双边网络
CSDN-Ada助手: 你好，CSDN 开始提供 #论文阅读# 的列表服务了。请看：https://blog.csdn.net/nav/advanced-technology/paper-reading?utm_source=csdn_ai_ada_blog_reply 。如果你有更多需求，请来这里 https://gitcode.net/csdn/csdn-tags/-/issues/34?utm_source=csdn_ai_ada_blog_reply 给我们提。
利用U-Net进行数据集的影像分割时数据集的制作
Deeeep Learning: sry, 这个我不太懂
利用U-Net进行数据集的影像分割时数据集的制作
BSD_S998: 你好，我想问一下，将.json文件转为标注图像的时候Creating dataset: data_dataset_voc class_names: ('_background_', 'redleaf', 'tree', 'flower') Saved class_names: data_dataset_voc\class_names.txt Generating dataset from: litchi\003.json Skipping shape: label=flower, shape_type=polygon Skipping shape: label=redleaf, shape_type=polygon Generating dataset from: litchi\004.json Skipping shape: label=tree, shape_type=polygon Skipping shape: label=flower, shape_type=polygon Generating dataset from: litchi\005.json Skipping shape: label=redleaf, shape_type=polygon，出现了Skipping shape是什么原因呀？最后生成的文件夹里内容也不一样

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。