位置注意力和通道注意力机制

最新推荐文章于 2024-06-05 18:19:25 发布

shu_0233

最新推荐文章于 2024-06-05 18:19:25 发布

阅读量1.6w

点赞数 13

分类专栏：深度学习

本文链接：https://blog.csdn.net/qq_33746593/article/details/107202590

版权

深度学习专栏收录该内容

6 篇文章 1 订阅

订阅专栏

Position Attention Module

捕获特征图的任意两个位置之间的空间依赖，对于某个特定的特征，被所有位置上的特征加权和更新。权重为相应的两个位置之间的特征相似性。因此，任何两个现有相似特征的位置可以相互贡献提升，而不管它们之间的距离.。

特征图A（C*H*W）首先分别通过3个卷积层（BN和Relu）得到三个特征图{B,C,D},shape为（C*H*W），然后reshape为C*N，其中N=H*W，为像素的数量。
矩阵C和B的转置相乘，在通过softmax得到spatial attention map S（N*N）
矩阵D和S的转置相乘，reshape result到(CxHxW)再乘以尺度系数 α 再reshape为原来形状（C*H*W），最后与A相加得到最后的输出E

S矩阵的每一个元素为 $S_{ji}=\frac{exp(B_i \cdot C_j)}{ \sum ^N_{i=1} exp(B_i \cdot C_j) }$ ， $S_{ji}$ 表示位置 $i$ 对位置 $j$ 的影响。E中的每一个元素为 $E_j = \alpha \sum_{i=1}^N (S_{ji} \cdot D_i)+A_j$ , $\alpha$ 为尺度因子， $D_i$ 为D的元素， $A_j$ 为A的元素

S矩阵相当于一个attention，它的每一行计算的是，所有像素与某个像素之间的依赖关系，softmax概率化，softmax值越大，说明更可信，相对的依赖性也更强。

Channel Attention Module

在Channel Attention Module中，分别对A做reshape（C*N）和reshape与transpose(N*C)
将得到的两个特征图相乘再通过softmax得到channel attention map X(C×C)
X与A做乘积再乘以尺度系数β再reshape为原来形状（C*H*W），最后与A相加得到最后的输出E。

其中β初始化为0，并逐渐的学习分配到更大的权重。S矩阵的每一个元素为 $x_{ji}=\frac{exp(A_i \cdot A_j)}{\sum_{i=1} ^Cexp(A_i \cdot A_j)}$ ， $x_{ji}$ 表示第 $i^{th}$ 通道对通道 $j^{th}$ 的影响。E中的每一个元素为 $E_j=\beta \sum_{i=1}^C(x_{ji}\cdot A_i)+A_j$ ， $\beta$ 为尺度因子， $x_i$ 为 $x$ 的元素(权重)， $A_j$ 为 $A$ 的元素.

需要注意的是，在计算两个通道的关系之前，我们没有使用卷积层来计算特征，因为它可以维持不同通道之间的映射关系。此外，与通过全局池化或者编码层来探索通道关系不同，我们利用所有相关位置的空间信息来建模通道的相关性。

References

arXiv(Paper): https://arxiv.org/abs/1809.02983
github(Code): https://github.com/junfu1115/DANet

shu_0233

关注

13
点赞
踩
121

收藏

觉得还不错? 一键收藏
1
评论
位置注意力和通道注意力机制

Position Attention Module捕获特征图的任意两个位置之间的空间依赖，对于某个特定的特征，被所有位置上的特征加权和更新。权重为相应的两个位置之间的特征相似性。因此，任何两个现有相似特征的位置可以相互贡献提升，而不管它们之间的距离。特征图A（C*H*W）首先分别通过3个卷积层（BN和Relu）得到三个特征图{B,C,D},shape为（C*H*W），然后reshape为C*N。矩阵C和B的转置相乘，在通过softmax得到spatial attention map S（N*
复制链接

扫一扫