自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(1)
  • 收藏
  • 关注

原创 数据挖掘——最佳划分度量(1)

前言有很多度量可以用来确定划分记录的最佳方法。选择最佳划分的度量通常是根据划分后子女结点不纯性的程度。不纯的程度越低,类分布就会越倾斜。例子:类分布为(0,1)的结点具有零不纯性(是比较好的)均衡分布(0.5,0.5)的结点具有最高的不纯性提示:以下是本篇文章正文内容,下面案例可供参考一、不纯性度量的公式注意:p(i|t)表示给定结点t中属于i类的比例①熵(信息论中使用较多)Entropy(t)=②基尼值Gini(t)=③分类误差Classification error(t)=

2020-10-08 12:19:27 1625 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除