Dual Attention Network for Scene Segmentation的两个注意力模块

最新推荐文章于 2024-06-21 19:32:01 发布

KirutoCode

最新推荐文章于 2024-06-21 19:32:01 发布

阅读量715

点赞数 1

分类专栏： Else method

本文链接：https://blog.csdn.net/McEason/article/details/104168171

版权

本文介绍了DANet如何通过双注意力模块改进场景分割，弥补传统方法在特征融合上的不足。DANet在位置和通道上应用注意力机制，选择性地增强不显眼物体的特征，提高识别精度。网络结构包含ResNet处理后的特征，通过两个平行的注意力模块和膨胀FCN进行融合，实现全局和局部特征的有效结合。

摘要由CSDN通过智能技术生成

理论说明

其他方法的不足：

之前的方法使用多层特征融合、LSTM、graph来获取特征依赖的方法效率低
如果嵌入的上下文是已经探索过的(就是经过了不少卷积层吧），重要的、显眼的物体特征影响会不显眼的物体的特征，从而影响识别

在卷积，池化的过程中，不显眼的特征逐渐被显眼的特征取代，所以下手的话要在最开始的地方下手？

DANet优点：

作者的方法能有选择性的融合不起眼的物体的相似特征，让这个特征更明显，以此来避免显眼的物体的影响

不起眼的物体的单独的力量是渺小的，可能也不突出，但是经过全部特征加权求和之后，所有的不起眼的物体的特征都会变得显眼。
但是，那些salient物体的特征也会更显眼啊？如此的话环境的影响似乎变淡了，因为相似的物体少
不同的特征都在不同的channel上，每个通道管一些特征，加注意力后这些特征会更明显？
检测不同的尺度需要的特征是一样的，作者的方法从全局的角度适应性的融合任何scale的相似特征

作者的网络中没有类似多尺度的东西，只是用两个注意力模组就获得了很好的结果，到底为什么还不知道