YOLOv7 | 注意力机制 | 添加ECA注意力机制

kay_545

已于 2024-05-29 16:38:58 修改

阅读量484

点赞数 2

分类专栏： YOLOv7/v9改进涨点合集文章标签： YOLO

于 2024-03-26 16:16:47 首次发布

本文链接：https://blog.csdn.net/m0_67647321/article/details/137049433

版权

YOLOv7/v9改进涨点合集专栏收录该内容

3 篇文章 0 订阅

订阅专栏

原理简介

代码实现

yaml文件实现（tips：可以添加不同的位置）

ECA是通道注意力机制的一种实现形式，是基于SE的扩展。

作者认为SE block的两个FC层之间的降维是不利于channel attention的权重学习的，并且捕获所有通道之间的依存关系是效率不高且是不必要的。权重学习的过程应该直接一一对应。

ECA 注意力机制模块直接在全局平均池化层之后使用1x1卷积层，去除了全连接层。该模块避免了维度缩减，并有效捕获了跨通道交互。并且ECA只涉及少数参数就能达到很好的效果。

ECA通过一维卷积 layers.Conv1D 来完成跨通道间的信息交互，卷积核的大小通过一个函数来自适应变化，使得通道数较大的层可以更多地进行跨通道交互。

⭐欢迎大家订阅我的专栏一起学习⭐

🚀🚀🚀订阅专栏，更新及时查看不迷路🚀🚀🚀
YOLOv5涨点专栏：http://t.csdnimg.cn/CNQ32

YOLOv8涨点专栏：http://t.csdnimg.cn/tnoL5

YOLOv7专栏：http://t.csdnimg.cn/HsyvQ

💡魔改网络、复现论文、优化创新💡

最近，通道注意力机制已被证明在提高深度卷积神经网络（CNN）性能方面具有巨大潜力。然而，大多数现有方法致力于开发更复杂的注意力模块以实现更好的性能，这不可避免地增加了模型的复杂性。为了克服性能和复杂性权衡的悖论，（ECA）模块一种高效通道注意，该模块仅涉及少量参数，同时带来了明显的性能增益。通过剖析 SENet 中的通道注意力模块，凭经验证明避免降维对于学习通道注意力非常重要，适当的跨通道交互可以保持性能，同时显着降低模型复杂性。因此，一种无需降维的局部跨通道交互策略，可以通过一维卷积有效实现。此外，一种自适应选择一维卷积核大小的方法，确定局部跨通道交互的覆盖范围。ECA 模块高效且有效，

原理简介

给定通过全局平均池化 (GAP) 获得的聚合特征，ECA 通过执行大小为 k 的快速一维卷积来生成通道权重，其中 k 通过通道维度 C 的映射自适应确定。

首先回顾 SENet 中的通道注意模块（即 SE 块）。然后，我们通过分析降维和跨渠道交互的影响，对 SE 区块进行实证诊断。这促使我们提出 ECA 模块。此外，一种自适应确定 ECA 参数的方法，并最终展示如何将其应用于深度 CNN。

在重新审视SE块之后，进行了实证比较，分析通道降维和跨通道交互对通道注意力学习的影响。根据这些分析，提出了高效的通道注意力（ECA）模块。

为了验证其效果，我们将原始 SE 块与其三个变体（即 SE-Var1、SE-Var2 和 SEVar3）进行比较，所有变体均不执行降维。结果表明通道注意力有能力提高深度CNN的性能。同时，SE-Var2独立学习每个通道的权重，在涉及的参数较少的情况下略优于SE块。这可能表明通道及其权重需要直接对应，同时避免降维比考虑非线性通道依赖性更重要。此外，采用单个 FC 层的 SEVar3 的性能优于在 SE 块中进行降维的两个 FC 层。所有上述结果都清楚地表明，避免降维有助于学习有效的通道注意力。因此，我们开发了没有通道降维的 ECA 模块。