Gini系数(Gini Coefficient,基尼系数)

**Gini系数(Gini Coefficient,基尼系数)**是一种衡量不平等分布的统计方法,常用于评估收入、财富等在一个群体中的不平等程度。基尼系数的取值范围在0到1之间,其中0表示完全平等,1表示完全不平等。

基尼系数的计算方法如下:

假设有N个个体,pi 表示第i个个体拥有某项财富或收入的比例(相对于总体的比例),则基尼系数 G 可以通过以下公式计算:

在这里插入图片描述

在实际应用中,基尼系数的计算经常用于评估分类模型的不纯度(impurity)。在决策树算法中,基尼系数被用于衡量某个节点的不纯度,从而在构建决策树时选择最优的分割点。

在分类问题中,对于一个具有K个类别的节点,基尼系数的计算方式如下:

在这里插入图片描述

其中,pk 表示属于类别k的样本在节点中的比例。

选择最优分割点时,通常会计算分割后的子节点的加权基尼系数,然后选择使得基尼系数最小的分割点。

基尼系数越小,表示节点的不纯度越低,也就是说节点中的样本更加纯净。在构建决策树时,算法会选择使得基尼系数减小最多的分割点。

  • 5
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值