[pytorch]语义分割之DANet: Dual Attention Network for Scene Segmentation(训练代码+预测代码)

最新推荐文章于 2024-05-16 16:04:53 发布

ZJE_ANDY

最新推荐文章于 2024-05-16 16:04:53 发布

阅读量5.7k

点赞数 8

分类专栏： # 语义分割语义/实例/全景分割

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u014453898/article/details/100576769

版权

语义分割同时被 2 个专栏收录

9 篇文章 14 订阅

订阅专栏

语义/实例/全景分割

7 篇文章 8 订阅

订阅专栏

一，DANet（双注意力模型）

网络结构：

网络有两个注意力分支，一个是位置注意力模型(PAM)，另一个是通道注意力模型(CAM)：

位置注意力模型(PAM)：

A是通过Resnet网络提起的特征图，维度是CxHxW。把A送入一个卷积层，得到特征图B和C，B和C的维度也是CxHxW。然后把B和C的维度reshape成CxN,（N=HxW）即N是特征图的像素个数。然后再把B进行矩阵转置，维度就变成NxC。然后B和C进行矩阵乘法，得到一个NxN的注意力矩阵，其再通过softmax处理，就变成了S，S的维度也是NxN。

S的元素计算如下：

Sji 表示第i个像素对第j个像素的影响。两个像素越相近，他们的Sji值越大。

然后，再把A输入到一个卷积层，输出特征图D，D的维度是CxHxW，并把特征图D的维度reshape为CxN，然后再把D和S的转置矩阵(并reshape成CxHxW) 作矩阵乘法，最后乘上一个参数，和A加起来，得到最后的输出矩阵E，E的维度为CxHxW。

E的元素计算如下：

通道注意力模型 (CAM)：

与PAM的计算不同的是，CAM是直接计算注意力矩阵X的。先把特征图A的维度reshape为CxN(N=HxW)，然后再把A和A的转置矩阵进行矩阵乘法运算，再经过softmax层，就得到了注意力矩阵X了，X的维度为CxC，X的元素计算如下：

Xji 表示第i个通道对第j个通道的影响。

然后我们再把 X的转置矩阵与A做矩阵乘法，得到的矩阵的维度为CxR，再reshape成CxHxW，最后该矩阵乘上一个参数，再与A矩阵相加，就得到了最终的输出E矩阵，E的维度为CxHxW。E的元素计算如下：

二，代码链接：

https://github.com/Andy-zhujunwen/danet-pytorch

三，效果：

关注

8
点赞
踩
32

收藏

觉得还不错? 一键收藏
4
评论
[pytorch]语义分割之DANet: Dual Attention Network for Scene Segmentation(训练代码+预测代码)

一，DANet（双注意力模型）网络结构：网络有两个注意力分支，一个是位置注意力模型(PAM)，另一个是通道注意力模型(CAM)：位置注意力模型(PAM)：A是通过Resnet网络提起的特征图，维度是CxHxW。把A送入一个卷积层，得到特征图B和C，B和C的维度也是CxHxW。然后把B和C的维度reshape成CxN,（N=HxW）即N是特征图的像素个数。然后再把B进行矩阵转...
复制链接

扫一扫

专栏目录

评论 4

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。