【可解释论文阅读】13.LRP（Layer-wise relevance propagation相关性分数逐层传播）

isLauraL

已于 2023-03-12 13:46:27 修改

阅读量1.6w

点赞数 25

分类专栏：机器学习的可解释文章标签：人工智能机器学习

于 2021-11-21 20:52:08 首次发布

本文链接：https://blog.csdn.net/m0_43455312/article/details/121458860

版权

机器学习的可解释专栏收录该内容

3 篇文章

订阅专栏

On Pixel-Wise Explanations for Non-Linear Classifier Decisions by Layer-Wise Relevance Propagation

期刊
PLOS one
一个风评不佳的水刊，但这篇论文算是精品，很多顶会顶刊都有引用

论文内容

目的
找出输入像素x的每个输入像素 $x_{(d)}$ 对特定预测 $f (x)$ 的贡献

主要思想的公式
$f(x)\approx \sum_{d=1}^VR_d$

主要思想的图片
提出的新概念
LRP，layer-wise relevance propagation 相关性分数逐层传播

提出的这一方法不涉及图像分割
方法建立在预先训练好的分类器之上
LRP作为由一组约束定义的概念，满足约束的方案都认为遵守LRP，作者给两个特定分类器订制了解决方案。本文只关注LRP在多层网络（Multilayer Networks）上的思想。ps:也不关注泰勒分解。

LRP较详解

像上图右侧部分所示，对于LRP来说，第一层是输出，最后一层是输入
每一层各个维度（某个维度就是某个神经元）的相关性之和守恒
$…=\sum_{d\in l+1}R_{d}^{l+1}=\sum_{d\in l}R_{d}^{l}=…=\sum_{d}R_{d}^{1}$

Multilayer Network之LRP

一般的网络（Multilayer Network）可以表示为：
$z_{ij} = x_{i}w_{ij},$
$z_{j} = \sum_{i}z_{ij}+b_j,$
$x_{j} = g(z_{j})$

解释：
①神经元i*神经元i与神经元j之间的权重，得到zij
②把所有神经元到神经元j的zij合起来加上bias term 偏置项，得到上一层所有神经元到神经元j的向量zj
③经激活函数g（like sigmoid relu）处理得到下一层神经元xj

泰勒部分
不看
LRP部分——Layer-wise relevance backpropagation
下图是图形示例

对于 $R_{i\leftarrow j}^{(l,l+1)}$ 含义的示意图

工作原理：

Knowing the relevance of a certain neuron $R_{j}^{(l+1)}$ for the classification decision $f (x)$ , one would like to obtain a decomposition of such relevance in terms of messages sent to neurons of the previous layers. We call these messages $R_{i\leftarrow j}$

了解特定神经元与分类决策函数 $f (x)$ 的相关性 $R_{j}^{(l+1)}$ ，希望根据发送到前一层（靠近input为前）的神经元的消息来获得这种相关性的分解，称这些消息是 $R_{i\leftarrow j}$ 。
其中， $\sum_{i}$ ：给定层所有神经元之和； $\sum_{j}$ ：某一层所有神经元之和

公式为：
$\sum_{i}R_{i\leftarrow j}^{l,l+1}$ = $R_{j}^{(l+1)}$
含义： $l + 1$ 层的某个神经元j的相关性 $=$ $l + 1$ 层的神经元 $j$ 给 $l$ 层所有神经元的相关性之和

z：向量（ $l + 1$ 层所有的神经元合起来）
一个线性网络
，在这里，相关性分数为 $R_{j} = f(x)$ ,这样的话，分解可以直接由式子得到 $R_{i\leftarrow j} = z_{ij}$ 。然而，一般情况下，激活神经元xj对于zj来说是非线性的函数，对于这种，有两种公式，一种是对于激活函数是双曲正切tanhx或者修正函数max(0,x)可以用以下第一个公式，其他的可以用第二个。