期望最大化注意力网络EMANet ：Expectation-Maximization Attention Networks for Semantic Segmentation

最新推荐文章于 2024-01-27 20:09:52 发布

我是大可爱

最新推荐文章于 2024-01-27 20:09:52 发布

阅读量2.7k

点赞数 1

分类专栏：论文文章标签：语义分割

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/woshidakeai/article/details/102822177

版权

主要参考：https://zhuanlan.zhihu.com/p/78018142（论文作者知乎发的专栏）

https://blog.csdn.net/qq_34914551/article/details/100927668（其他博主对EMANET的理解）

代码：https://github.com/XiaLiPKU/EMANet

目录

（1）Expectation-Maximization Algorithm (EM)

（2）Gaussian Mixture Model (GMM)

（3）Non-local

Expectation-Maximization Attention

（1）Responsibility Estimation Responsibility（E）

（2）Likelihood Maximization(M)

（3）Data Re-estimation (R)

Structure of EMA Unit

Abstract

自注意机制已广泛应用于各种任务中。它通过将所有位置的特征加权求和来计算每个位置的表示。因此，它可以捕捉计算机视觉任务的远程关系。然而，它在计算上是有限的。因为注意力图是计算w.r.t所有其他位置。在这篇论文中，我们将注意力机制表述为期望最大化的方式，并在此基础上对注意力图进行了更紧凑的估计。通过对这些基的加权求和，得到的表示是低秩的，并且反对输入的噪声信息。所提出的期望最大化注意(EMA)模块对输入的方差具有较强的鲁棒性，并且在内存和计算方面也很友好。建立了基地维护和规范化的方法，稳定了基地的培训流程。我们在PASCAL VOC、PASCAL Context和COCO 等常用的语义分割数据集上进行了大量的实验.

Introduction

本文所提出的期望最大化注意力机制（EMA），摒弃了在全图上计算注意力图的流程，转而通过期望最大化（EM）算法迭代出一组紧凑的基，在这组基上运行注意力机制，从而大大降低了复杂度。其中，E步更新注意力图，M步更新这组基。E、M交替执行，收敛之后用来重建特征图。本文把这一机制嵌入网络中，构造出轻量且易实现的EMA Unit。其作为语义分割头，在多个数据集上取得了较高的精度。

Contributions

本文的主要贡献如下:

（1）将自我注意机制重新表述为期望最大化迭代方式，这种迭代方式可以学习更紧凑的基集，大大降低计算复杂度。本文是第一个将EM迭代引入注意机制的研究。

（2）将提出的期望最大化作为神经网络的一个轻权模块，并建立了具体的基维护和归一化方法。

（3）在PASCAL VOC、PAS- CAL Context和COCO等三个具有挑战性的语义分割数据集上进行了大量的实验，证明了我们的方法相对于其他最先进的方法的优越性。

Preliminaries

（1）Expectation-

最低0.47元/天解锁文章

我是大可爱

关注

1
点赞
踩
13

收藏

觉得还不错? 一键收藏
2
评论
期望最大化注意力网络EMANet ：Expectation-Maximization Attention Networks for Semantic Segmentation

主要参考：https://zhuanlan.zhihu.com/p/78018142（论文作者知乎发的专栏） https://blog.csdn.net/qq_34914551/article/details/100927668（其他博主对EMANET的理解）代码：https://github.com/XiaLiPKU/EMANet目录Abstra...
复制链接

扫一扫

专栏目录

我是大可爱 CSDN认证博客专家 CSDN认证企业博客

码龄7年

5: 原创

26万+: 周排名

59万+: 总排名

1万+: 访问

: 等级

247: 积分

11: 粉丝

6: 获赞

6: 评论

63: 收藏

私信

关注

分类专栏

最新评论

Side window filter
bitera: 均值滤波把O（M*N）的复杂度变成O（1）复杂度这跟我优化的SmartBlur算法滑动窗口统计像素基本一样的思路，但还是有点区别，因为SmartBlur是计算窗口像素一定阈值范围内的平均，包含比较、累加和计数再计算均值，如果只使用width长度的临时数组并不能实现，还需要记录每列符合比较条件的像素数和窗口向下移动后减去原窗口第一行符合条件的像素值和计数，所以换一种思路，建立一个(图像宽度+窗口宽度)*窗口宽度长度的临时数组来记录更多像素，考虑到使用这个记录时能够更快（按顺序取用）所以记录时不是完全按顺序记录的，这也不影响记录速度，因为除数滑动窗口在最上侧和最左侧之外其他位置只记录滑动窗口右下角一个像素值就可以了，图像输出结果为每像素与记录的窗口记录像素值作比较累加计数计算平均值。使用此方法优化后运行效率比原生窗口每像素比较计算提升了大约5倍。还可以接着优化，就是再用一个临时数组，在记录窗口像素时顺便统计该像素值的数量，图像输出结果时不用比较窗口所有像素了，直接统计阈值范围内像素*相应数量的平均值就可以了，大大降低了运算量，这部分计算对窗口大小也不敏感了，结合使用多线程，实测效率可提升几十倍。
python-opencv裁剪tif遥感影像
monopoly_: 这个裁剪完之后没有坐标系了怎么办
2017语义分割综述
weixin_47492798: 请问图22是出自哪一篇文章呀
期望最大化注意力网络EMANet ：Expectation-Maximization Attention Networks for Semantic Segmentation
我是大可爱: 跑通了
期望最大化注意力网络EMANet ：Expectation-Maximization Attention Networks for Semantic Segmentation
人工智障之语义分割从入门到放弃/: 代码你跑通了吗，博主

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。