使用 CatBoost 实现分类特征的 SHAP

茶桁

于 2024-09-17 07:45:00 发布

阅读量20

点赞数

分类专栏：茶桁的 AI 会员专栏文章标签：分类数据挖掘人工智能 SHAP

版权声明：本文为博主原创文章，遵循 CC 4.0 BY 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/ivandoo/article/details/142301566

版权

茶桁的 AI 会员专栏专栏收录该内容

134 篇文章 0 订阅 ¥79.90 ¥99.00

订阅专栏

超级会员免费看

避免对分类特征的 SHAP 值进行后处理

结合 [[CatBoost]] 和 [[SHAP]] 可以提供强大的洞察力。特别是当你使用分类特征时。CatBoost 处理这些特征的方式使你更容易理解使用 SHAP 的模型。

对于其他建模包，我们需要先使用 One-Hot 编码转换分类特征。问题是每个二进制变量都有自己的 SHAP 值。这使得很难看到原始分类特征的整体贡献。

在 [分类特征的 SHAP](…/分类特征的 SHAP) 中，我们探讨了一种解决方案。它涉及深入研究 SHAP 对象并手动添加各个 SHAP 值。这可能很乏味！作为替代方案，我们可以使用 CatBoost。

CatBoost 是一个梯度提升库。与其他库相比，它的一大优势是它可以处理非数值特征。无需转换分类特征即可使用它们。这意味着 CatBoost 模型的 SHAP 值易于解释。每个分类特征只有一个 SHAP 值。

我们将：

计算并解释 CatBoost 模型的 SHAP 值
应用 SHAP 聚合 ——我们将看到，在理解分类特征的关系时，它们的作用是有限的
为了解决这个限制࿰

了解本专栏

超级会员免费看

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

茶桁 CSDN认证博客专家 CSDN认证企业博客

码龄18年

莉莉丝游戏

198: 原创

1万+: 周排名

8870: 总排名

11万+: 访问

: 等级

3847: 积分

1799: 粉丝

1826: 获赞

32: 评论

1874: 收藏

私信

关注

热门文章

分类专栏

最新评论

探索 TorchRe-ID--基于 Python 的人员再识别库
2401_85342132: 因为不能用windows
探索 TorchRe-ID--基于 Python 的人员再识别库
zhaobingtao_: 请问博主，为啥我按照上述复现的时候会显示raise ConnectionError(e, request=request) requests.exceptions.ConnectionError: HTTPSConnectionPool(host='drive.google.com', port=443): Max retries exceeded with url: /uc?id=1LaG1EJpHrxdAxKnSCJ_i0u-nbxSAeiFY (Caused by NewConnectionError('<urllib3.connection.HTTPSConnection object at 0x000002D519382088>: Failed to establish a new connection: [WinError 10060]，这个错误呢？开了VPN也不行，但项目的其他模型可以正常运行，比如resnet50等等，均运行正常
计算机视觉核心步骤
CSDN-Ada助手: 推荐 Python入门技能树：https://edu.csdn.net/skill/python?utm_source=AI_act_python
机器学习中的可解释性
茶桁: 一个是模型本身可解释，一个是黑盒，再通过其他工具进行解释。
机器学习中的可解释性
Nous_Lee: interpretable 和 explainable 翻译过来都是可解释的，有什么区别吗

大家在看

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

茶桁 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。