GBDT、XGboost、lightGBM 之feature_importances_ 的计算方法

scott198512

已于 2022-06-21 09:45:30 修改

阅读量1.7w

点赞数 2

分类专栏：机器学习文章标签：机器学习决策树 python

于 2019-10-15 11:33:53 首次发布

原文链接：https://blog.csdn.net/jin_tmac/article/details/87939742

版权

机器学习专栏收录该内容

39 篇文章 32 订阅 ¥29.90 ¥99.00

订阅专栏

超级会员免费看

在用sklearn的时候经常用到feature_importances_ 来做特征筛选，那这个属性到底是啥呢。

在这里插入图片描述

分析gbdt的源码发现来源于每个base_estimator的决策树的
feature_importances_

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

由此发现计算逻辑来源于cython文件，这个文件可以在其github上查看源代码

而在DecisionTreeRegressor和DecisionTreeClassifier的对feature_importances_定义中

到此决策树的feature_importances_就很清楚了：impurity就是gini值，weighted_n_node_samples 就是各个节点的加权样本数，最后除以根节点nodes[0].weighted_n_node_samples的总样本数。
下面以一个简单的例子来验证下：

在这里插入图片描述
上面是决策树跑出来的结果，来看petal width (cm)就是根节点，
featureimportance=(112∗0.6647−75∗0.4956−37∗0)/112=0.5564007189feature_importance=(112*0.6647-75*0.4956-37*0)/112=0.5564007189feature
i

mportance=(112∗0.6647−75∗0.4956−37∗0)/112=0.5564007189,
petal length (cm)的
featureimportance=(75∗0.4956−39∗0.05−36∗0.1528)/112=0.4435992811feature_importance=(75*0.4956-39*0.05-36*0.1528)/112=0.4435992811feature
i

mportance=(75∗0.4956−39∗0.05−36∗0.1528)/112=0.4435992811
忽略图上gini计算的小数位数，计算结果相同。

关注

2
点赞
踩
27

收藏

觉得还不错? 一键收藏
0
评论
GBDT、XGboost、lightGBM 之feature_importances_ 的计算方法

sklearn常用feature_importances_ 特征筛选
复制链接

扫一扫

专栏目录

博客等级

码龄13年

149
原创

966
点赞

4328
收藏

2万+
粉丝

关注

私信

热门文章

分类专栏

最新评论

matplotlib/seaborn 绘图可视化全面总结
都督Android教学: 大佬高质量文章，图文并茂，逻辑清晰，受益匪浅，期待大佬新作。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
pandas 用法全面总结
疯狂Android讲义: 干货满满，实用性强，博主的写作风格简洁明了，让人一目了然。文章涵盖了很多实用的知识点。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
Git客户端(TortoiseGit)使用详解
2401_84170414: 优质好文，支持支持。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
Git客户端(TortoiseGit)使用详解
莫晓前端资料: 大佬的文章写的太精辟了让我深刻了解了这篇文章的精髓谢谢大佬分享，希望继续创作优质博文。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
Python中动画显示与gif生成
2401_84140569: 文章构思巧妙，结构紧凑，既有深度又有广度，读后让人受益匪浅，确实是一篇值得一读的佳作。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。