“Why Should I Trust You?”:Explaining the Predictions of Any Classifier 论文笔记

“Why Should I Trust You?”:Explaining the Predictions of Any Classifier论文笔记

KDD 2016 原文链接

Motivation

本篇文章主要思路是在一个复杂的模型中的局部提出一个简单地可解释地模型(Explainer),以提升整个复杂模型的可解释性。

本文首先对 Explainer定了两个评价标准(criterion):

  1. Interpretable:即为解释output到底是由input的哪一个特征来决定的,占比又是多少。
  2. Local Fidelity:局部忠诚,文章中的原话是 it must correspond to how the model behaves in the vicinity of the instance being predicted。即是说解释模型对于某一些近邻样本的判别依据和被解释针对所有样本的判别依据应该是大致相同的。

在这里插入图片描述

实际例子

Example 1: Text classification with SVMs

在这里插入图片描述
如图A2,Algorithm 2所判断的文本是无神论还是有神论的主要依据是“Post”,“Host”,虽然它的Accuracy很高,但它依然不可信的。

Example 2: Deep networks for images

在这里插入图片描述
原文:We explain the prediction of Google’s pre-trained Inception neural network [25] in this fashion on an arbitrary image。

LIME

Fidelity-Interpretability Trade-off

一个Explainer的fidelity和interpretablity从某种程度上来说是不可兼得的,所以文章定义了如下的优化目标:
在这里插入图片描述
其中 g g g表示Explainer, f f f表示需要被解释地模型, π x \pi_{x} πx表示在总样本中按照sample method π ( ) \pi() π()选取的局部样本, L ( f , g , π x ) L(f,g,\pi_x) L(f,g,π

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值