可解释机器学习 Task03 - CAM可解释性分析

最新推荐文章于 2022-12-19 16:02:16 发布

T4neYours

最新推荐文章于 2022-12-19 16:02:16 发布

阅读量260

点赞数

分类专栏： Datewhale——可解释机器学习文章标签：深度学习人工智能

本文链接：https://blog.csdn.net/Insistence0807/article/details/128349469

版权

Datewhale——可解释机器学习专栏收录该内容

5 篇文章 1 订阅

订阅专栏

CAM可解释性分析

一、CAM算法简介
二、算法说明
三、SqueezeNet算法
- 1.算法简介
四、研究意义

一、CAM算法简介

论文: Learning Deep Features for Discriminative Localization

CAM算法简介：，展示指定类别在原图上重点关注的特征区域。并巧妙用图像分类实现弱监督定位。打破深度学习的黑箱子，让人工智能展示自己的“注意力”和“学到的特征”。

在这里插入图片描述

CAM算法的精妙之处

对深度学习实现可解释性分析、显著性分析
可扩展性强，后续衍生出各种基于CAM的算法
每张图片、每个类别，都能生成CAM热力图
弱监督定位:图像分类模型解决定位问题
潜在的“注意力机制
使得Machine Teaching成为可能

二、算法说明

1.算法步骤

输入原始图像
全卷积神经网络（无池化）
最后一层卷积层输出512个 feature map (channel) ，每一个 channel（矩阵）大小都是都是14*14。（其中蓝色层、红色层、绿色层都是14 *14的矩阵，一共512层）这512层对应卷积神经网络提取出来的512个特征
全局平均池化（GAP）：将每一层的矩阵取平均值，得到一个512*1的向量，起到了全连接层的作用
线性分类层：对于n个类别，训练得到对应上一层的平均数的权重（权重的大小间接地反映出对于对应卷积层（对应特征）的关注程度）
将权重与平均数进行线性组合（相乘后相加），得到n个线性分类分数（logit），再进行softmax操作，则得到了n个概率（后验置信度、后验概率）
找到后验概率最大的top1、top3或者top5，得到图像分类的结果