别以为if slse很简单——决策树
熵与Gini指数
熵,表示信息量的期望,含义是混乱程度,也是对随机变量编码所需的最小比特数。请参考之前的文章https://mp.csdn.net/editor/html/107641395
基尼不纯度,它表示是分错的概率的期望。Gini不纯度其实可以看作是熵的近似值,形式一样没有取对数更容易计算,二分类时,都是概率取0.5时达到最大值。Gini不纯度是一种不等性度量,取值[0,1],当数据完全相等时取0.
https://zhuanlan.zhihu.com/p/76667156
https:/.
原创
2021-03-12 17:34:27 ·
366 阅读 ·
0 评论