特征重要性的判断维度与计算过程

#以下内容为个人学习记录,有不准确的地方,欢迎指正,感谢!

一、判断特征重要性(feature_importances_)的维度(importance_type)

权重(weight):在所有树中一个特征被用来分裂数据的次数。

覆盖(cover):在所有树中一个特征被用来分裂数据的次数,并且有多少数据点通过这个分裂点。

增益(gain):使用特征分裂时平均训练损失的减少量

二、计算过程
假设根节点A,二级节点B(B有3级节点 B1 和B2)和 C(C没有下一层的节点)
A的importances_=(A.GINI * A.TOTAL-B.GINI * B.TOTAL - C.GINI*C.TOTAL)/A.TOTAL

B的importances_=(B.GINI * B.TOTAL-B1.GINI * B1.TOTAL - B2.GINI*B2.TOTAL)/A.TOTAL

之后归一化处理
A.feature_importances=A.importances/(A.importances+B.importances)
B.feature_importances=B.importances/(A.importances+B.importances)

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值