- CART生成算法(分类树)
在这里需要提一下基尼系数:
注意:基尼指数也表示样本的不确定性,基尼指数值越大,样本集合的不确定性越大。
算法实现步骤:
1)计算现有样本DD的基尼指数,之后利用样本中每一个特征AA,及AA的每一个可能取值aa,根据A>=aA>=a与A<aA<a将样本分为两部分,并计算Gini(D,A)Gini(D,A)值
2)找出对应基尼指数最小Gini(D,A)Gini(D,A)的最优切分特征及取值,并判断是否切分停止条件,否,则输出最优切分点
3)递归调用1)2)
4)生成CART决策树
转载自:https://blog.csdn.net/LY_ysys629/article/details/72809129