机器学习笔记四—机器学习可解释性

系列文章目录

  1. 机器学习笔记一—机器学习基本知识
  2. 机器学习笔记二—梯度下降和反向传播
  3. 机器学习笔记三—卷积神经网络与循环神经网络
  4. 机器学习笔记四—机器学习可解释性
  5. 机器学习笔记五—机器学习攻击与防御
  6. 机器学习笔记六—模型压缩


前言

  前边学习了一部分机器学的例子和相关基础知识,了解到机器学习实际上就是去寻找适合的函数,但是实际上到底所谓的适合的函数究竟是如何得来的,这一节我们重点介绍机器学习的可解释性

一、解释机器学习

  对于训练好的模型,我们输入猫的图片它会告诉我们这是猫,我们输入狗的模型,它会告诉我们这是狗,但是它又是怎么判断图片显示的究竟是什么呢?

1.控制变量法

  对于一张图片,它会有很多的component(成分),我们可以一个一个的去更改或者去除这些成分,如果当更改某一个成分时发现模型的检测结果发生较大变化,那么这个成分就是模型判断图片分类的根本因素
  例如,我们可以在图片的某个位置上添加一个方块来掩盖原来的图像,按照某种规律移动方块,根据模型检测结果,我们可以确定模型判断图片类别的决定因素是什么。

注:红色位置代表对于模型判断影响不大,蓝色区域代表对于模型判断影响较大

2.梯度计算法

  我们可以微小的更改xn的大小然后看更改哪一个xn时yk的变化较大,为了更方便的计算x对于yk的影响,我们可以通过梯度来计算,图片中越亮的位置代表改点的梯度越大,即对于模型的的分类结果影响更大
  对于这种方法这里有几个具体的例子

  但是这里面还存在一个问题——梯度饱和

  鼻子的长度和模型判断图片是大象的概率关系很大,但是我们计算梯度的时候会发现,当大象的鼻子长度大于某个值的时候,模型判断是大象的几率不再增大,这也就是梯度饱和,梯度的变化率由大变小渐渐趋近于0

3.梯度计算法具体例子

  这是我们之前举过的例子,通过梯度上升的方法寻找模型“心里”认为最像某个数的图像,我们得到了图片左的结果,我们发现它得出的结果和人类大脑所想象的结果完全不同,所以我们需要加一些别的限制   例如我们可以添加“像素”的限制,让像素点尽量的少,通过梯度上升所得到的模型“理想”图片尽量黑白分明,这时我们发现我们得到的模型的理想图片要比之前更接近人类大脑认为的样子

  又例如:

  前边我们提到过通过梯度上升的方法,我们可以寻找一个x使得yi最大,现在我们还可以通过生成器寻找这样的x,我们可以将一个低维向量输入生成器,由生成器生成一个x,再将x输入到分类模型中,这有一些类似于生成对抗网络

4.用可解释的模型解释复杂的模型——LIME

  LIME的方法就是用一个可解释的模型去解释一个目前不可解释的模型,例如我们进行图片识别,我们想要知道进行图片识别的模型C是怎么识别出图片的,C通过图片的那一部分判定图片是树蛙。

  首先我们可以将整个图片分成M部分,然后随机取模型的几个部分输入到C中,得到一个概率,然后分别进行取样,如图所示我们取三个样本,分别输出到C中,得到分别的概率,然后寻找一个可解释的模型P去解释C,这里我们选择全连接模型去拟合输出的概率(0.85、0.52、0.01),我们可以采用one-hot编码,被删除的部分标0,留下的部分标1   通过全连接模型P的权重,我们就可以了解到图片某一部分的重要性,权重越大那一部分的重要性越大,反之越小,而如果出现了负权重则表示,这一部分对于判断它是树蛙反而有反作用。

  这里是LIME的一些相关知识
https://blog.csdn.net/happytofly/article/details/80122605

总结

  将前边提到的机器学习的解释问题从整体上简要的叙述了一下

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值