利用Shap解释Xgboost（或者别的）模型

最新推荐文章于 2025-03-20 08:57:05 发布

CristinaM

最新推荐文章于 2025-03-20 08:57:05 发布

阅读量1.4w

点赞数 8

分类专栏：资料 XGboost 数据分析

本文链接：https://blog.csdn.net/weixin_43615654/article/details/103436632

版权

Shap的一些介绍：
SHAP包
 算法解析
 shap的中文解析
 知乎的翻译
ps,sklearn库的模型可以用lime模块解析

DEMO1

参（chao)考(xi)利用SHAP解释Xgboost模型
 数据集
数据集基本做了特征处理，就基本也不处理别的了。

检查下缺失值

print(data.isnull().sum().sort_values(ascending=False))

gk                          9315
cam                         1126
rw                          1126
rb                          1126
st                          1126
cf                          1126
lw                          1126
cm                          1126
cdm                         1126
cb                          1126
lb                          1126

data.isnull().sum(axis=0).plot.barh()
plt.title("Ratio of missing values per columns")
plt.show()

在这里插入图片描述

获取年龄

days = today - data['birth_date']
print(days.head())

0    8464 days
1   12860 days
2    7487 days
3   11457 days
4   14369 days
Name: birth_date, dtype: timedelta64[ns]

关于年龄计算这一块

day2 = (today - data['birth_date'])

0    8464 days
1   12860 days
2    7487 days
3   11457 days
4   14369 days
Name: birth_date, dtype: timedelta64[ns]

day2 = (today - data['birth_date']).apply(lambda x: x.days)
#把天数提取成整数

0     8464
1    12860
2     7487
3    11457
4    14369
Name: birth_date, dtype: int64

获得年龄特征

data['age'] = np.round((today

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

CristinaM

关注关注

8
点赞
踩
133

收藏

觉得还不错? 一键收藏
6
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

机器学习-XGBoost和SHAP解析数据

qq_45932996的博客

08-18

2533

接下来，通过切片操作从 shap_values 中提取出每个类别的 SHAP 值，分别存储shap_values_class_1，shap_values_class_2 和 shap_values_class_3 中。为后续的工作准备好所需的工具，我们需要引入如 numpy 、pandas 用于数据处理，xgboost 用于模型构建，用于模型解释的shap，用于可视化的seaborn和matplotlib，以及 sklearn 中的一些模块用于数据划分、评估指标计算等。展示了特征间的交互作用对预测的影响。

XGBoost模型构建+SHAP解析-Python代码——用XGBoost模型实现机器学习并进行黑箱过程解析

qq_41698317的博客

07-16

8430

本文中的代码可直接运行。XGBoost模型构建+SHAP解析-Python代码——用XGBoost模型实现机器学习并进行黑箱过程解析。XGBoost（Extreme Gradient Boosting）是一个基于梯度提升（Gradient Boosting）框架的增强算法，广泛应用于分类、回归、排序等任务。信用风险评估销售预测病毒检测图像识别。

6 条评论您还未登录，请先登录后发表或查看评论

Xgboost-Shap模型解释分析：分类与回归的机器学习模型可视化与解释工具,Xgboost-shap模型解释分析，Xgboost有分类器和回归器两种，shap用于对各种特征重要性可视化，用于对机器

02-06

Xgboost-Shap模型解释分析：分类与回归的机器学习模型可视化与解释工具,Xgboost-shap模型解释分析，Xgboost有分类器和回归器两种，shap用于对各种特征重要性可视化，用于对机器模型的解释分析自带数据集 ,Xgboost; shap模型; 特征重要性; 模型解释分析; 自带数据集,"Xgboost与SHAP模型解释分析：分类与回归的可视化"

基于python的回归预测＋SHAP 可视化解释

m0_65963495的博客

03-20

483

【代码】基于python的回归预测＋SHAP 可视化解释。

利用SHAP解释Xgboost模型

qq_45531594的博客

10-08

1万+

Xgboost相对于线性模型在进行预测时往往有更好的精度，但是同时也失去了线性模型的可解释性。所以Xgboost通常被认为是黑箱模型。 2017年，Lundberg和Lee的论文提出了SHAP值这一广泛适用的方法用来解释各种模型（分类以及回归），其中最大的受益者莫过于之前难以被理解的黑箱模型，如xgboost和神经网络模型。本教程中，我们在真实数据集上进行实操，利用SHAP来解释Xgboost模型。预计学习用时：30分钟。本教程基于Python 3.6版本、Xgboost 0.82版本以及shap 0

解析收入预测：如何使用 SHAP 解释 XGBoost 模型

陈锐的技术笔记

10-27

1545

Adult 数据集：该数据集包含多种特征，如年龄、教育程度、工作类型、每周工作小时数等，用于预测一个人的收入水平。特征包括：Age: 年龄: 教育年限其他特征如性别、职业、工作时长等。

机器学习黑盒？SHAP（SHapley Additive exPlanations）使用 XGBoost 的可解释机器学习

fulk6667g78o8的专栏

01-06

3016

在公众号「python风控模型」里回复关键字：学习资料QQ学习群：1026993837 领学习资料模型可解释性这是一个关于错误解释机器学习模型的危险以及正确解释它的价值的故事。如果您发现诸如梯度提升机或随机森林之类的集成树模型的鲁棒准确性很有吸引力，但也需要解释它们，那么我希望您发现这些信息有用且有帮助。试想一下，我们的任务是预测个人Ô为n行的财务状况。我们的模型越准确，银行赚的钱就越多，但由于此预测用于贷款申请，因此法律上也要求我们解释为什么做出预测。在对多种模型类型进行试验后，我们发现 XGBoost

XGBoost R 教程 3：SHAPforxgboost

🧑‍🎓 博士研究生在读 🔬 分享生物信息学、神经生物学方面的知识 💬 合作请在后台留言

11-09

2219

而且，比较上图中的模型 B 和模型 A，模型 B 的输出实际上被修改了，它更多地依赖于给定的特征（Cough，输出分数增加了 10），所以 Cough 应该是一个更重要的特征。sina plots 使用每个观测值的每个特征的 SHAP 值显示特征对模型输出的贡献分布（在本例中为 CWV 测量误差的预测）。使用上面模型 A 的数据集作为一个简单的示例，哪个特征首先进入数据集会通过 Gain 生成相反的特征重要性：无论哪个特征较晚（在树中较低的位置）都会获得更多的信用。这为数据集中的每个观察提供了模型解释。

机器学习模型解释性：基于SHAP值的XGBoost等模型可视化分析

04-10

内容概要：本文详细介绍了如何利用SHAP（Shapley Additive Explanations）值对多种机器学习模型（如XGBoost、CatBoost、随机森林等）进行解释性可视化。主要内容包括：构建基础模型、计算SHAP值并生成不同类型的可视...

Xgboost-Shap模型解释分析：分类与回归的机器学习模型可视化与解释工具

最新发布

04-29

内容概要：本文详细介绍了如何利用SHAP（Shapley Additive Explanations）工具对Xgboost模型进行解释和可视化。首先，通过波士顿房价数据集展示了回归任务中特征重要性的可视化方法，包括使用summary_plot生成蜜蜂图...

shap解释xgboost模型

05-16

对于 XGBoost 模型，可以利用 SHAP 来解释模型的预测结果。具体步骤如下： 1. 加载数据集并训练 XGBoost 模型。 2. 使用 SHAP 计算每个特征对每个样本的贡献值。 3. 可视化 SHAP 值，展示每个特征对预测结果的...

xgboostExplainer:一个R包，使xgboost模型完全可解释

05-12

xgboost解释器一个R包，使xgboost模型完全可解释

SHAP（五）：使用 XGBoost 进行人口普查收入分类

May the Force be with you

12-02

1943

本笔记本演示了如何使用 XGBoost 预测个人年收入超过 5 万美元的概率。它使用标准 UCI 成人收入数据集。要下载此笔记本的副本，请访问。XGBoost 等梯度增强机方法对于具有多种形式的表格样式输入数据的此类预测问题来说是最先进的。Tree SHAP（）允许精确计算树集成方法的 SHAP 值，并已直接集成到 C++ XGBoost 代码库中。这允许快速精确计算 SHAP 值，无需采样，也无需提供背景数据集（因为背景是从树木的覆盖范围推断出来的）。

ML之shap：基于boston波士顿房价回归预测数据集利用shap值对XGBoost模型实现可解释性案例

头部AI社区如有邀博主AI主题演讲请私信—心比天高，仗剑走天涯，保持热爱，奔赴向梦想！低调，专注，谦虚，自律，反思，成长，还算比较正能量的博主，公益免费传播…内心特别想在AI界做出一些可以推进历史进程影响力的技术(兴趣使然，有点小情怀，也有点使命感呀

07-03

3798

ML之shap：基于boston波士顿房价回归预测数据集利用shap值对XGBoost模型实现可解释性案例目录基于boston波士顿房价回归预测数据集利用shap值对XGBoost模型实现可解释性案例# 1、定义数据集# 2、数据集预处理# 4、基于XGBR模型实现shap值分析# 4.1、模型建立并训练# 4.2、基于模型本身输出特征重要性# 4.3、局部独立图可视化某特征的变化如何影响模型的输出及该特征值的分布# 4.4、利用Shap值解释XGBR模型# 4.5、基于XGBoost模型实现Shap值可

【深度学习·命运-48】SHAP-xgboost应用

m0_69378371的博客

12-09

846

SHAP 是一种基于 Shapley 值的模型解释方法，它为每个特征提供了清晰、可解释的贡献度量，能够帮助我们理解复杂模型的决策过程。SHAP 具有强大的理论基础，能够提供一致、公正的解释，并且适用于多种机器学习任务。尽管 SHAP 在计算上可能会存在一些开销，但它为模型的可解释性提供了一个强大的工具，尤其在需要高可信度和透明度的场景（如医疗、金融、法律等）中具有重要应用价值。

XGBoost结合SHAP应用：回归、二分类、多分类模型