Gini指数、Gini系数、Gini不纯是一回事吗?

决策树算法CART中用的是哪一个?

用的是Gini impurity,也就是基尼不纯。

 

Gini impuirty是什么?

假设这个数据集里有kk种不同标签,第ii个标签所占的比重为pipi,那么Gini impurity为

 

1−∑i=1kp2i,1−∑i=1kpi2,

它描述了一个数据集中标签分布的纯度,类似于entropy。

 

Gini coefficient是什么?

Gini coefficnet针对于二元分类问题。对于二元分类问题,我们的预测结果会有对应的ROC AUC,那么

 

GiniCoefficient=2AUC−1GiniCoefficient=2AUC−1

 

 

经济学中的基尼系数是什么?和上面的GiniCoefficient是一回事吗?

是的,本质是一回事。经济学中GiniCoefficient用累计分布来衡量一个地区财富的分配的合理程度。当G=0G=0,说明财富均匀分配。

分类问题中,GiniCoefficient用累积分布衡量正负两种标签的分配合理程度。当G=0G=0,说明正负标签的预测概率均匀分配,模型相当于是随机排序,所以AUC=0.5AUC=0.5。

 

Gini index是什么?

这是一个尴尬的问题,因为很多时候有人把gini index等价于gini impurity,但有人有时候把它用作gini coefficient。你自己看懂别人的上下文就好了,自己可以避免使用,防止让别人误会。

http://sofasofa.io/forum_main_post.php?postid=1001461

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值