[可解释机器学习]Task06:LIME算法学习

本文分为两个部分:

  1. LIME算法讲解
  2. LIME论文逐句精读 

一、 LIME算法讲解

LIME是一种可以解释任务机器学习模型预测结果的通用方法

  • 对于表格数据,如葡萄酒训练集 ,输入葡萄酒特征判断其是否为一个好的葡萄酒

        哪些类别对模型被判断为好的贡献最大

        我们可以把特征重要度,以及每个特征对模型预测为指定类别的贡献,定量展示出来

  • 对于图像分类而言,我们可以将图像中一些对模型预测产生关键影响的区域高亮显示出来 

  •  对文本分类进行可解释性分析,如预测一个文本是无神论的,还是基督教的

 判断一个人是高收入还是低收入

能够明白到底是哪些特征让模型认为这个人是高收入还是低收入

 预备知识:机器学习、线性分类、决策树 

 model-agnostic通用的,可解释任何一种机器学习

local是指只能拟合出待测样本模型的一个局部行为

interpretable是指其行为人类能够理解,可解释的

有些法律上要求人工智能必须具有可解释性

 开始简述LIME

弱水三千只取一瓢 

LIME实际上是一种范式

小局部上是线性的 

 

 得到了每一个特征的重要性可以分析出可解释分析的结果

 表格数据LIME可解释性分析

 先选一个待测样本,然后对待测样本的特征进行扰动(因为都是实数,可以做加减乘除)

把模型预测的结果作为标注 ,扰动的样本作为特征,去训练一个可解释的模型

图像数据LIME可解释性分析 

 比较麻烦,因为要对待测数据进行扰动,RGB三个通道的像素矩阵很难在像素层面上进行扰动,得自己设计一套扰动的范式

 这里直接将图形分块,直接判断存在不存在,存在就保留原来的像素,不存在就抹成灰色

每个图像有两种可能性,n个图块就有2^n个扰动的可能性

 

 

 

 可以将这2^n个领域的样本输入到原始模型中,获得原始模型的预测结果

 

 

 

 判断哪部分图块对模型判断产生影响

 判断模型到底是在关注前景还是背景

 

 文本数据LIME可解释性分析

文本很特殊,词向量根本不可解释

 用词袋模型将其变为可解释特征

 选取有代表性的样本

人类的耐心和时间都是极其有限的

 先算出每一个特征的代表性,然后尽量覆盖代表性高的特征去选取代表性样本

实验

人工智能是通过判断背景雪地来判断哈士奇的 

 

 讨论

LIME的优点:

  1. 兼容任意一种机器学习算法
  2. 特征重点性:解释、理解、信赖、改进(特征工程)
  3. What-if场景:如果每个月多挣500元,额度是多少
  4. 可解释单个样本预测结果、选取代表性样本
  5. 可人工设计、构造可解释特征

但是成也萧何,败也萧何

LIME的缺点

  1. 人工设计、构造的“可解释特征”,不一定科学
  2. “局部线性”可能无法拟合原模型,有许多锯齿状边缘,不平滑
  3. 不同样本,如何计算领域样本权重
  4. 每个待测样本都需训练对应可解释模型,耗时长

 LIME的改进:自适应距离

 

 Optimal line能够调节出最适合的半径

二、LIME论文逐句精读 

论文选择的是:"Why Should l Trust You?":Explaining the Predictions of Any Classifier

具体阅读笔记在EndNote中,需要可留言

论文目录:

  1. Introduction
  2. The case for explanations
  3. Local lnterpretable Model-Agnostic Explanations
  4. Submodular Pick for Explaining Models
  5. Simulated User Experiments
  6. Evaluation with human subjects
  7. Related Work
  8. Conclusion and Future Work

部分内容如下:

 

 总结:LIME是一种模块化和可扩展的方法,可以对任何模型做可解释性分析的预测。还引入了SP-LIME,这是一种选择代表性和非冗余预测的方法,为用户提供了模型的全局视图。论文中实验表明,解释对于文本和图像领域中与信任相关的任务中的各种模型都很有用,可供非专业人士使用。

  • 4
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值