CAM（class attention map）

最新推荐文章于 2025-03-29 09:21:00 发布

「已注销」

最新推荐文章于 2025-03-29 09:21:00 发布

阅读量2.1k

点赞数 1

分类专栏：深度学习知识

本文链接：https://blog.csdn.net/YJYS_ZHX/article/details/111628803

版权

本文介绍了CAM（Class Attention Map）的主要思想，即通过加权求和与全局平均池化来生成反映分类贡献程度的注意力图。适用场景主要是网络结构中全连接层前有全局平均池化的网络。文章还提供了生成CAM的代码流程，包括获取图片、预处理、创建网络、生成注意力图和展示等步骤，并强调了预处理、网络结构理解、参数获取、广播机制和opencv的使用等关键点。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1 主要思想

在这里插入图片描述
上图中，网络的最后一个卷积层，经过全局平均池化后，后跟上全连接，经过softmax输出类别。其公式描述为：

Sc是c类对应的全连接的输入，也就是加权求和，k代表第k层，c代表第c类。f为第k层（x,y）处的激活值，求和符号是GAP，其前面经过w加权求和，输出为Sc。其等价于：
在这里插入图片描述
在（1）中第二行是先利用第c类对应的权重值w1~wk与特征图的每一层对应相乘，也就是给每层都分配一个权重，之后所有特征图沿通道合并，也就是将k通道变为1通道，最后再全局平均池化。

也就是说，先GAP后加权求和，等价于，先加权求和后GAP。

此处的对于类c，先对特征图进行加权求和，得到的就是所说的cam图。图上的每一点反映了其对分类为类c的贡献程度，其经过GAP就是全连接的输入了。

2 适用场景

只适用网络中全连接前是GAP的网络。至于其他的场景，也有使用梯度，或者非梯度作为特征图层的权重的方法。

3 代码

思路：
获取图片以及类别，对图片进行预处理；
创建网络，获取网络特征图以及权重参数；
生成CAM；
展示。

1 ）导入包

from torchvision import models, transforms
import torchsnooper
import numpy as np
import cv2
import requests
from PIL import Image
import io
from torch.autograd import Variable
import torch
import torch.nn.functional as F

2）获取图片以及对应的类别，并进行预处理

LABELS_URL = 'https://s3.amazonaws.com/outcome-blog/imagenet/labels.json'
classes = {
   int(key):value for (key, value) in requests.get(LABELS_URL).json().items()} #获取类别信息，键值对

IMG_URL = 'http://media.mlive.com/news_impact/photo/9933031-large.jpg'
reponse = requests.get(IMG_URL) 
img_pil = Image.open(io.BytesIO(reponse.content)