最佳模型解释器LIME来了！Github已达 8.9K stars!

最新推荐文章于 2024-03-14 21:14:22 发布

我爱Python数据挖掘

最新推荐文章于 2024-03-14 21:14:22 发布

阅读量3k

点赞数 1

分类专栏： python 文章标签：数据挖掘机器学习深度学习神经网络模型可解性

本文链接：https://blog.csdn.net/weixin_38037405/article/details/118313872

版权

python 专栏收录该内容

600 篇文章 330 订阅

订阅专栏

欢迎关注我，专注Python、数据分析、数据挖掘、实用工具！

简单的模型例如线性回归，LR等模型非常易于解释，但在实际应用中的效果却远远低于复杂的梯度提升树模型以及神经网络等模型。

现在大部分互联网公司的建模都是基于梯度提升树或者神经网络模型等复杂模型，遗憾的是，这些模型虽然效果好，但是我们却较难对其进行很好地解释，这也是目前一直困扰着大家的一个重要问题，现在大家也越来越加关注模型的解释性。

本文介绍一种解释机器学习模型输出的方法LIME。它可以认为是SHARP的升级版，Github链接：https://github.com/marcotcr/lime，有所收获，点赞支持一下。

LIME

LIME（Local Interpretable Model-agnostic Explanations）支持的模型包括：

结构化模型的解释；
文本分类器的解释；
图像分类器的解释；

LIME被用作解释机器学习模型的解释，通过LIME我们可以知道为什么模型会这样进行预测。

本文我们就重点观测一下LIME是如何对预测结果进行解释的。

代码

此处我们使用winequality-white数据集，并且将quality<=5设置为0，其它的值转变为1.

# !pip install lime
import pandas as pd
from xgboost import XGBClassifier
import shap
import numpy as np
from sklearn.model_selection import train_test_split

df = pd.read_csv('./data/winequality-white.csv',sep = ';')
df['quality'] = df['quality'].apply(lambda x: 0 if x <= 5 else 1)
df.head()

在这里插入图片描述

# 训练集测试集分割
X = df.drop('quality', axis=1)
y = df['quality'] 
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=1)
# 模型训练
model = XGBClassifier(n_estimators = 100, random_state=42)
model.fit(X_train, y_train)
score = model.score(X_test, y_test)
score

The use of label encoder in XGBClassifier is deprecated and will be removed in a future release. 0.832653061224489

对单个样本进行预测解释

下面的图中表明了单个样本的预测值中各个特征的贡献。

import lime
from lime import lime_tabular

explainer = lime_tabular.LimeTabularExplainer(
    training_data=np.array(X_train),
    feature_names=X_train.columns,
    class_names=['bad', 'good'],
    mode='classification'
)

模型有84%的置信度是坏的wine，而其中alcohol,total sulfur dioxide是最重要的。
在这里插入图片描述

exp = explainer.explain_instance(data_row=X_test.iloc[1], predict_fn=model.predict_proba)
exp.show_in_notebook(show_table=True)

模型有59%的置信度是坏的wine，而其中alcohol,chlorides, density, citric acid是最重要的预测参考因素。
在这里插入图片描述

exp = explainer.explain_instance(data_row=X_test.iloc[3], predict_fn=model.predict_proba)
exp.show_in_notebook(show_table=True)

适用问题

LIME可以认为是SHARP的升级版，它通过预测结果解释机器学习模型很简单。它为我们提供了一个很好的方式来向非技术人员解释地下发生了什么。您不必担心数据可视化，因为LIME库会为您处理数据可视化。

参考链接

https://www.kaggle.com/piyushagni5/white-wine-quality
LIME: How to Interpret Machine Learning Models With Python
https://github.com/marcotcr/lime
https://mp.weixin.qq.com/s/47omhEeHqJdQTtciLIN2Hw

技术交流

欢迎转载、收藏、有所收获点赞支持一下！

在这里插入图片描述
目前开通了技术交流群，群友超过2000人，添加方式如下：

如下方式均可，添加时最好方式为：来源+兴趣方向，方便找到志同道合的朋友

方式一、发送如下图片至微信，进行长按识别，回复加群；
方式二、直接添加小助手微信号：pythoner666，备注：来自CSDN
方式三、微信搜索公众号：Python学习与数据挖掘，后台回复：加群

在这里插入图片描述

我爱Python数据挖掘

关注

1
点赞
踩
7

收藏

觉得还不错? 一键收藏
1
评论
最佳模型解释器LIME来了！Github已达 8.9K stars!

简单的模型例如线性回归，LR等模型非常易于解释，但在实际应用中的效果却远远低于复杂的梯度提升树模型以及神经网络等模型。现在大部分互联网公司的建模都是基于梯度提升树或者神经网络模型等复杂模型，遗憾的是，这些模型虽然效果好，但是我们却较难对其进行很好地解释，这也是目前一直困扰着大家的一个重要问题，现在大家也越来越加关注模型的解释性。本文介绍一种解释机器学习模型输出的方法LIME。它可以认为是SHARP的升级版，Github链接：https://github.com/marcotcr/lime，有所收获，点赞
复制链接

扫一扫