集成树模型的可解释性

Leon_124

于 2020-10-11 14:01:19 发布

阅读量962

点赞数

分类专栏： Matlab Python 机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/SDAU_LY124/article/details/109011080

版权

Python 同时被 3 个专栏收录

28 篇文章

订阅专栏

14 篇文章

订阅专栏

7 篇文章

订阅专栏

机器学习模型相比于统计模型，显著的劣势是其可解释性。做回归时，统计模型有系数有P-value，机器学习却只能谈精度——但若论精度，统计模型折腾来折腾去，还是玩不过机器学习的。

但人们对机器学习模型的可解析性并没有放弃，并一直在努力进行改进。树模型便是其中的佼佼者。集成树中，最出名的当属Random Forest（RF）和Gradient boosting trees（GBM），后者也是近年来大火的XGB的根基。而解释集成树模型的两大利器：Feature importance和Partial dependence，则成了树模型的炫耀资本——高精度+快速+可解析性。

新的特征重要值的评价方法： permutation importances （ impurity-based feature importances can be misleading for high cardinality features (many unique values). 因此可以使用permutation importances 替换.

从下图可以看出二者结果存在差异：

Feature Importance (MDI), Permutation Importance (test set)

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

Leon_124 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。