构建SHAP模型踩雷过程

最新推荐文章于 2025-05-29 10:27:40 发布

程序员裘千仞

最新推荐文章于 2025-05-29 10:27:40 发布

阅读量1.4k

点赞数

文章标签： python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_53065362/article/details/134104164

版权

文章讲述了作者在使用XGBoost构建回归模型并借助SHAP解释变量重要性时遇到的问题，包括大数据量导致的长时间运行和GPU引入后的ImportError。作者通过改用GPUTree和GPU计算、调整模型复杂度以及考虑租赁GPU以解决内存占用问题的过程。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

由于论文需要判断各个因子对因变量的重要性，因此利用XGBoost构建回归模型，加入SHAP解释各因子对因变量的重要性。在构建过程中遇见以下几个问题：
（1）输入数据过大，运行时间很长。
由于我的数据是栅格数据，读取以后约有500万条数据，我破烂的cpu跑了三天三夜也没出结果。
解决方法：改用GPUTree，调用GPU来构建SHAP模型，速度飞快！！
（2）改用GPU后，出现了一个重大问题，报错：

ImportError: cannot import name '_cext_gpu'

参照知乎大佬方式解决了，链接在这。其中复制仓库过程很慢，因此改为直接从Github下载完整的仓库压缩文件即可，注意登入Github账号才可完整下载
（3）现在GPUTree可以正确运行了，但是迎来了最重要的问题。
在XGBoost训练完毕后，计算SHAP值时会将计算机内存占满，随后才能调用GPU内存，具体原因我也不太清楚，有可能是需要将数据转换至GPU内存运行时占用太多计算机内存了。因此我的anaconda内核会一直挂掉
解决方案有两种：

1.租用GPU进行计算。我用的是Autodl，租个3080ti只要1.08每小时，还算便宜花不了几个钱。
2.降低模型复杂度！这点很奇怪，将XGB的复杂度适当降低以后就即可，并没有修改数据集的大小，但是会导致XGB拟合效果不理想！

所以最优选仍然是租用一个GPU，但是又要面临重新配置环境的困难，有可能需要重复问题（1）（2）了。

程序员裘千仞

博客等级

码龄5年

5
原创

13
点赞

19
收藏

7
粉丝

关注

私信

热门文章

上一篇：: IDM解决FTP下载缓慢问题--2

下一篇：: Python菜鸟百日计划 Day01~05

最新评论

Python菜鸟百日计划 Day01~05
CSDN-Ada助手: 恭喜！看到你开启了Python菜鸟百日计划，真是令人振奋！接下来，我建议你可以继续坚持每天的学习和总结，保持这种学习的热情和毅力。另外，可以考虑加入一些项目实战，这样可以更好地巩固所学知识。加油！期待你的下一篇博客！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
构建SHAP模型踩雷过程
CSDN-Ada助手: 恭喜您撰写第三篇博客！标题“构建SHAP模型踩雷过程”非常吸引人，我很期待阅读您的文章。持续创作是一种难能可贵的品质，您的努力和热情让我深感钦佩。在下一步的创作中，我建议您可以从以下角度展开：探索一些常见的SHAP模型中的问题，并分享您的解决方案；或者提供一些实用的技巧来避免踩雷的过程。总之，期待您在创作中再创佳绩，继续保持谦虚的态度。 CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3
IDM解决FTP下载缓慢问题--2
CSDN-Ada助手: 非常棒的博客！你的解决方法对于FTP下载缓慢问题非常实用。继续写博客，分享更多技巧吧！在这个主题上，还有一些相关的知识和技能可以扩展。例如，你可以介绍如何通过调整IDM的设置来优化下载速度，或者介绍其他类似的下载工具。另外，你还可以提到如何使用FTP软件进行批量下载，以及如何处理大文件的下载等等。希望这些建议能对你的创作有所帮助。加油！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2

大家在看

最新文章

目录

展开全部

收起

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。