python变量贡献率排序_103，每个特征的贡献率是多少？

最新推荐文章于 2023-03-09 17:38:19 发布

兔农农

最新推荐文章于 2023-03-09 17:38:19 发布

阅读量1.2k

点赞数

文章标签： python变量贡献率排序

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_35545176/article/details/113509087

版权

本文介绍了使用SHAP库解释机器学习模型输出的过程，并展示了在处理包含时间序列数据的多标签分类问题时遇到的问题。通过SHAP库对训练数据进行建模并解释预测，作者寻求理解每个时间步长的特征对结果的贡献。

摘要由CSDN通过智能技术生成

我最近发现了一个非常好的github存储库，名为SHAP，用Python和JavaScript编写。它可以用来解释任何机器学习模型的输出。你可以看到一个很好的视频here，它很好地解释了这个库。在

在python编写的一个分类问题中，我发现在使用这个库时可能会遇到一些小问题。在

说明：

我使用了整整103个特性来建模由-1、0和1描述的三个标签。

我所有的功能都定义得很好，而且都有一个相关的标题。问题是我没有在每个单位传递103个特性。我在每个时间单位传递103*15个特性，即当前时间t_0的103个特性和时代{}的相同特性。我的train数据集的形状是(35087, 15, 103)，其中第一个参数代表35087秒。在

这里有一个很明显的example我可以如何使用它：import shap

# we use the first 100 training examples as our background dataset to integrate over

explainer = shap.DeepExplainer(model, x_train[:100])

# explain the first 10 predictions

# explaining each prediction requires 2 * background dataset size runs

shap_values = explainer.shap_values(x_test[:10])

# init the JS visualization code

shap.initjs()

# transform the indexes to words

import numpy as np

words = imd

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。