Tensorflow2.* keras CBAM 代码实现

最新推荐文章于 2025-02-28 16:19:33 发布

老光头_ME2CS

最新推荐文章于 2025-02-28 16:19:33 发布

阅读量7.5k

点赞数 12

分类专栏： Tensorflow 学习笔记卷积神经网络文章标签： tensorflow 深度学习神经网络

本文链接：https://blog.csdn.net/Forrest97/article/details/106708658

版权

本文介绍了Tensorflow2.0中使用Keras实现CBAM模块的详细过程，包括Channel Attention和Spatial Attention的理论推导及代码实现。CBAM通过结合global maxpool和avgpool提升模型性能，相较于SENet，CBAM的max-pooling提供了更精确的通道注意力。此外，文章还提供了基于ResNet系列的模型搭建参考。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

文章目录

理论推导
代码复现

理论推导

整体模型框架

试验结果显示串联效果优于并联结果，channel attention在前优于spatial attention在前。
因此，最后采取的是一个channel attention module与一个spatial attention module串联的形式。
在这里插入图片描述
表达式如下：
${F}'=M_{c}(F)\bigotimes F$
${F}''=M_{s}({F}')\bigotimes {F}'$
式中，
$\in \mathbb{R}^{C\times H\times W }$ 表示module输入特征层
$M_{c} \in \mathbb{R}^{C\times 1\times 1 }$ 表示1D channel attention
$M_{s} \in \mathbb{R}^{1\times H\times W }$ 表示2D spatial attention
$\bigotimes$ 表示同位元素相乘