18-CCNet-Criss-Cross-Attention-for-Semantic-Segmentation

最新推荐文章于 2024-04-25 10:40:17 发布

jiyeyong

最新推荐文章于 2024-04-25 10:40:17 发布

阅读量2.7k

点赞数 6

分类专栏：语义分割

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u010067397/article/details/86408680

版权

语义分割专栏收录该内容

21 篇文章 1 订阅

订阅专栏

在这里插入图片描述

how

下图蓝色点为待处理像素点 $x_{i}$ ,处理后得到结果为红色点 $y_{i}$ :

（a）是Non-local，含蓝色中心的feature map是输入，分为上下两个分支处理：

深绿色分支代表已经完成Non-local操作，得到了 $f(x_{i},x_{j})$ (绿色的深浅则代表了当前位置与蓝色中心点的相关性大小)；

下面灰色分支代表进行了 $g(x_{j})$ 操作。将两个结果相乘，得到 $y_i$ (含红色中心的feature map).

（b）即为CCNet的改进，可以看到，深绿色 $f$ 部分是十字型结构，意即只计算当前 $x_{i}$ 周围十字型区域像素 $x_{j}$ 与它的相关性。当然，我们需要知道是所有像素与 $x_{i}$ 的相关性，于是作者将这个过程进行堆叠，并且通过实验发现，只需堆叠两次即可覆盖所有点，并超越non-local的效果。

为什么堆叠两次即可？

我们先看看信息是如何通过十字型结构传递的：

上图展示了蓝色像素点的信息传达到左下角点的过程：

第一次loop1，我们在计算左下角点的f时，只能包含左上角点和右下角点的信息，此时并没有左下角点与蓝色点的相关信息。

但在计算左上（or右下）点时，是计算了蓝色点与它们的相关性信息的。

第二次loop2，当我们再次计算左下角点的 $f$ 时，再次包含左上&右下点的信息，此时的左上&右下已经不是当初那个它们了2333，它们已经有了蓝色点的信息，此时便可以间接地将蓝色点信息传递给左下点。

同理，其他不在左下点十字型位置的像素点，都可以通过这种方式在第二次loop的时候就将信息传递给左下点。于是实现两次loop便“遍历”了所有点。

事实上，我们可以发现蓝色点信息是传递了两遍给左下点的（左上传递了一次，右下传递了一次），虽然是间接传递没有直接计算得到的结果强度大，但这种对于信息的两次加强也很有可能是最终效果略胜于 Non-local的原因之一。

于是乎，原本需要计算 $(H*W)^{2}$ 次，现在变为了 $(H*W)*(H+W-1)$ （一共 $H*W$ 个像素点，每个点只"观照"其十字型区域 $(H+W-1)$ 面积的像素）。计算效率大大提升！

以下是CCNet的网络结构：

reference

CCNet–于"阡陌交通"处超越恺明Non-local

关注

6
点赞
踩
13

收藏

觉得还不错? 一键收藏
3
评论
18-CCNet-Criss-Cross-Attention-for-Semantic-Segmentation

how下图蓝色点为待处理像素点 ,处理后得到结果为红色点 :（a）是Non-local，含蓝色中心的feature map是输入，分为上下两个分支处理：深绿色分支代表已经完成Non-local操作，得到了 (绿色的深浅则代表了当前位置与蓝色中心点的相关性大小)；下面灰色分支代表进行了操作。将两个结果相乘，得到 (含红色中心的feature map).（b）即为CC...
复制链接

扫一扫

专栏目录

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。