SE注意力机制（笔记）

qq_46595902

已于 2022-02-09 10:45:17 修改

阅读量9.0k

点赞数 4

文章标签：深度学习 cnn 神经网络

于 2022-02-09 10:32:06 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_46595902/article/details/122836044

版权

本文详细介绍了SENet的工作流程，首先通过卷积操作将4*4*3的输入图像转化为3*3*3的特征图，接着进行squeeze操作，使用全局平均池化压缩通道信息。然后通过excitation步骤，利用Sigmoid激活函数生成0-1之间的通道重要性权重，这些权重用于加权原始特征图的每个通道，从而实现通道注意力。SE注意力机制重点关注通道信息，但忽略了位置信息的影响。

摘要由CSDN通过智能技术生成

最近学习se注意力，做个笔记记录一下。

上图即为SEnet的整个流程，接下来开始讲解se注意力机制，首先我们输入一张彩色图片，假设图片尺寸为4*4*3（H'=4,w'=4,c'=3），经过一个卷积操作Ftr（卷积核为2），后变成3*3*3（H=3,W=3,C=3）。

R G B

接下来进行squeeze（压缩操作），通过全局平均池化来完成，将每个通道的H*W个像素值压缩为一个实数，公式如下

得到Z1=5/9, Z2=5/3, Z3=4/9,得到一组1*1*3的实数。

接下来进行第二步excitation激励操作，将这组1*1*3的实数先降维到1*1*（3/r），再升维到1*1*3，最后经过Sigmoid激活函数归一化为一组0~1的实数，这组0~1的实数就对应了每个通道的重要性，1为很重要，0为不重要，将得到的实数乘到之前feature map上对应通道的每个像素值。即最后输出 =（H*W*C）*（1*1*C）。所以说SE注意力机制只是单方面的考虑通道信息，没有考虑位置信息。

关注

4
点赞
踩
35

收藏

觉得还不错? 一键收藏
2
评论
SE注意力机制（笔记）

最近学习se注意力，做个笔记记录一下。上图即为SEnet的整个流程，接下来开始讲解se注意力机制，首先我们输入一张彩色图片，假设图片尺寸为4*4*3（H'=4,w'=4,c'=3），经过一个卷积操作Ftr（卷积核为2），后变成3*3*3（H=3,W=3,C=3）。接下来进行squeeze（压缩操作），通过全局平均池化来完成，公式如下得到Z1=5/9, Z2=5/3, Z3=4/9,得到一组1*1*3的实数。接下来进行第二步excitation激励操作，将这组1*1*3的实数先降.
复制链接

扫一扫

qq_46595902 CSDN认证博客专家 CSDN认证企业博客

码龄4年

2: 原创

133万+: 周排名

46万+: 总排名

2万+: 访问

: 等级

48: 积分

4: 粉丝

15: 获赞

6: 评论

93: 收藏

私信

关注

热门文章

最新评论

SE注意力机制（笔记）
wujunnan1230: 看了好几篇博文，就看到博主你的看懂了
mAP@.5和mAP@.5:0.95的区别
jim222m: IOU = 1很多框他沒說錯，因為他只要重疊面積為1以下都輸出，這樣說可能會誤解，換句說法就是IOU是對所有結果框去算重疊，當0時代表這些框都沒重疊就保留顯示，1時代表兩個輸出框重複了但還是兩個都顯示，所以數字越大代表你接受多大面積重疊的結果，1幾乎就表示全顯示。
mAP@.5和mAP@.5:0.95的区别
nupt_lzj: 要理解什么叫非极大值抑制，他是来抑制的，当IOU阈值很大，如阈值为0.9，当实际IOU值大于他才认为两个框预测的是同一个物体，才干掉其中一个，显然实际时iou很少这么大，那么就认为他们是预测不同物体，即不会被抑制掉，留下的框当然多了
mAP@.5和mAP@.5:0.95的区别
weixin_44916698: 我也想说这个，最后一句给我看懵了。。。
mAP@.5和mAP@.5:0.95的区别
Artin810: 最后一句，iou=0,才会有很多框吧

最新文章

mAP@.5和mAP@.5:0.95的区别

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。