- 博客(1)
- 收藏
- 关注
原创 数据挖掘——最佳划分度量(1)
前言有很多度量可以用来确定划分记录的最佳方法。选择最佳划分的度量通常是根据划分后子女结点不纯性的程度。不纯的程度越低,类分布就会越倾斜。例子:类分布为(0,1)的结点具有零不纯性(是比较好的)均衡分布(0.5,0.5)的结点具有最高的不纯性提示:以下是本篇文章正文内容,下面案例可供参考一、不纯性度量的公式注意:p(i|t)表示给定结点t中属于i类的比例①熵(信息论中使用较多)Entropy(t)=②基尼值Gini(t)=③分类误差Classification error(t)=
2020-10-08 12:19:27 1625 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人