CCNet_Criss-Cross Attention for Semantic Segmentation

最新推荐文章于 2023-10-16 21:14:07 发布

VIP文章 holmes_MX

最新推荐文章于 2023-10-16 21:14:07 发布

阅读量526

点赞数

分类专栏： Semantic Segmentation paper reading

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/holmes_MX/article/details/106319254

版权

0. 写作目的

好记性不如烂笔头。

1. 主要思路

目前的self-attention需要生成 N * N 的affinity 矩阵（其中N = H * W），作者提出存在一种更有效的方法？

因此作者提出了 Criss-Cross attention，使用“十字架” 的结构来代替所有的位置(感觉使用“十字架”的paper很多，比如GCN使用十字街的conv，SPNet使用“十字架”的Pooling)。然后使用两次 criss-cross attention，这样可以综合全部的空间信息。

2. 模型具体细节

reduction 先将使用3*3conv将channel降低为输入channel 的1/4.

然后加入在两层 Criss-cross Attention Module之后，然后使用3*3conv进行refine一下得到H‘’，然后与X 进行concat，

然后使用3*3conv + BN + dropuout + 1*1Conv输出结果（这里输出的是下采样的结果）。

作者这里也使用了辅助loss，在layer3 加入了辅助loss，权重为0.4。

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
CCNet_Criss-Cross Attention for Semantic Segmentation

0. 写作目的好记性不如烂笔头。1. 主要思路目前的self-attention需要生成 N * N 的affinity 矩阵（其中N = H * W），作者提出存在一种更有效的方法？因此作者提出了 Criss-Cross attention，使用“十字架” 的结构来代替所有的位置(感觉使用“十字架”的paper很多，比如GCN使用十字街的conv，SPNet使用“十字架”的Pooling)。然后使用两次 criss-cross attention，这样可以...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。