机器学习 --- 可解释性

最新推荐文章于 2024-01-07 02:05:53 发布

micklongen

最新推荐文章于 2024-01-07 02:05:53 发布

阅读量143

点赞数

分类专栏： # 机器学习文章标签：机器学习人工智能 c语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/micklongen/article/details/120927039

版权

机器学习专栏收录该内容

13 篇文章 0 订阅

订阅专栏

机器学习 - 可解释性

概述

观点
- Goal of ML Explanation != you completely know how the ML model work.
- Goal of ML Explanation is make people(your customers, your boss, yourself) comfortable.
- 针对不同的人，可能需要不同的解释\nPersonalized explanation in the future.
平衡点
- 在模型的可解释性和模型的泛化能力之间取得平衡

Explanation

Local Explanation
- 基本思想
  - 给定一个Object, 获取哪些Components 最重要，\n哪些不重要
  - 例如：给定一张图片，如何判断这是一张猫的图片
- 思路
  - 移除或者修改某个 Component 的值，观察修改后的结果\n1. 如果结果变化大，则是重要的\n2. 如果结果变化小，就是不重要的
  - 图像
    - 图像识别：可以通过遮住图片某一个部分，观察结果
      - 问题：遮挡板的大小、颜色
Global Explanation
- 基本思想
  - 例如：在机器看来，猫像什么？
- 思路
  - 通过对输入每个 Component 添加一个噪音，看结果输出的影响程度
- 图片特征生成器
  - 本质上就是，输入一个向量，生成一张图片\nby GAN，VAE，etc

思路

有些模型比较容易解释
- 线性方法
- 决策树
用可解释性的模型，解释不可解释性的行为
- 被解释模型：比如说神经网络
- 解释模型：跟被解释模型相同的输入和输出
- 重点：解释被解释模型的一部分，而不是全部
- 步骤
  - 给定要解释的点（或者要解释的一部分）
  - 在这个点的附近，采样
    - 如果是图片
      - 客户在图片上面加上噪音
      - 或者拿掉一些像素
      - 把图片切块，然后随机丢掉一些块
  - 用线性模型训练
  - 解释这个线性模型

Tools

Attribution
- Local Attribution
  - 问题
    - Saturation
      - 问题：某一个组件达到某一个程度，就不再变化
      - 思路：Global Attribution
    - Noisy gradient
      - 问题：像素对梯度的影响是杂乱的
      - 思路：SmoothGrad
        每次训练，针对每个像素加一个Noise
        假设一批是10张图片，求10张图片的均值，然后在做反馈
- global Attribution
  - Layer-wise relevance propagation(LRP)
    - 目标：input 对 output 的影响程度
- Completeness
  - 目标：score 上升的取值，各个 component 的贡献度
  - 算法
    - Flexible baseline
      - DeepLIFT
      - Integrated gradient
  - Sensitivity - n
- Heatmap
Probing
- 例子：BERT
Heatmap

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。