算法仓库
Cloud_Leung
这个作者很懒,什么都没留下…
展开
-
算法仓库(二) 什么是信息增益率
为什么要提出信息增益率这种评判划分属性的方法?信息增益不是就很好吗?其实不然,用信息增益作为评判划分属性的方法其实是有一定的缺陷的,书上说,信息增益准则对那些属性的取值比较多的属性有所偏好,也就是说,采用信息增益作为判定方法,会倾向于去选择属性取值比较多的属性。那么,选择取值多的属性为什么就不好了呢?举个比较极端的例子,如果将身份证号作为一个属性,那么,其实每个人的身份证号都是不相同的,也就是说,转载 2017-12-18 17:40:49 · 1287 阅读 · 0 评论 -
算法仓库(一) 什么是信息增益
文章是转载的,这篇文章网络上各处转载实在太多,而且几乎所有转载都是直接复制而没进行过处理,导致其中的重要部分:数据丢了。我在查看了各个文章后,把数据部门进行了补全,希望能为自己以后保留一个记录,也希望能带给后来人一些帮助,文章末尾会标明转载的来源,虽然我也不清楚这到底是不是最终的源头。—————————————————————————————————分割线———————————转载 2017-12-18 15:36:19 · 2107 阅读 · 0 评论 -
算法仓库(三) 决策树分类
决策树是一种树形结构,为人们提供决策依据,决策树可以用来回答yes和no问题,它通过树形结构将各种情况组合都表示出来,每个分支表示一次选择(选择yes还是no),直到所有选择都进行完毕,最终给出正确答案。本文介绍决策树如何来实现分类,并用来预测结果。先抛出问题。现在统计了14天的气象数据(指标包括outlook,temperature,humidity,windy),并已知这些天气转载 2017-12-19 15:06:36 · 1011 阅读 · 0 评论