“Why Should I Trust You?”：Explaining the Predictions of Any Classifier 论文笔记

最新推荐文章于 2021-08-22 16:17:47 发布

ChrisXue228

最新推荐文章于 2021-08-22 16:17:47 发布

阅读量1.5k

点赞数

分类专栏： X-AI 文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_40423134/article/details/103833459

版权

“Why Should I Trust You?”：Explaining the Predictions of Any Classifier论文笔记

KDD 2016 原文链接

Motivation

本篇文章主要思路是在一个复杂的模型中的局部提出一个简单地可解释地模型（Explainer），以提升整个复杂模型的可解释性。

本文首先对 Explainer定了两个评价标准（criterion）：

Interpretable:即为解释output到底是由input的哪一个特征来决定的，占比又是多少。
Local Fidelity:局部忠诚，文章中的原话是 it must correspond to how the model behaves in the vicinity of the instance being predicted。即是说解释模型对于某一些近邻样本的判别依据和被解释针对所有样本的判别依据应该是大致相同的。

在这里插入图片描述

实际例子

Example 1: Text classification with SVMs

在这里插入图片描述
如图A2，Algorithm 2所判断的文本是无神论还是有神论的主要依据是“Post”，“Host”，虽然它的Accuracy很高，但它依然不可信的。

Example 2: Deep networks for images

在这里插入图片描述
原文：We explain the prediction of Google’s pre-trained Inception neural network [25] in this fashion on an arbitrary image。

LIME

Fidelity-Interpretability Trade-off

一个Explainer的fidelity和interpretablity从某种程度上来说是不可兼得的，所以文章定义了如下的优化目标：
在这里插入图片描述
其中 $g$ 表示Explainer， $f$ 表示需要被解释地模型， $\pi_{x}$ 表示在总样本中按照sample method $\pi()$ 选取的局部样本， $L(f,g,\pi_x)$

最低0.47元/天解锁文章

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
“Why Should I Trust You?”：Explaining the Predictions of Any Classifier 论文笔记

“Why Should I Trust You?”：Explaining the Predictions of Any Classifier论文笔记KDD 2016 原文链接Motivation
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。