CART 算法【python,机器学习,算法】

27 篇文章 0 订阅
20 篇文章 0 订阅

CART(Classification and Regression Tree)分类回归树。使用基尼指数计算得到树的节点。基尼指数表示系统整体的不确定性,
不确定性越大,基尼指数越大,所以在决策树中,将加权基尼系数最小的特征作为树的决策节点。

公式推导

  1. 基尼指数
    g i n i ( A ) = 1 − ∑ i ∈ ( y , n ) p i 2 gini(A)=1-\sum\limits_{i\in(y,n)}p_i^2 gini(A)=1i(y,n)pi2
    其中 p i p_i pi表示单分组中,yes或者no的比例(这里指的是样本中分类标签下的值,只有yesno两类)。
  2. 加权基尼指数
    w e i g h t _ g i n i = ∑ i = 1 k p i   g i n i ( A ) i weight\_gini=\sum\limits_{i=1}^{k}p_i\ gini(A)_i weight_gini=i=1kpi gini(A)i,
    其中 p i p_i pi表示单分组占总样本的比例, g i n i ( A ) i gini(A)_i gini(A)i表示单分组的基尼指数。
  • 6
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值