Data Mining
文章平均质量分 89
小小数据挖掘工程师
即将毕业小硕一枚,记录自己编程学习生涯!可以交个朋友吗?一起撸代码鸭!
展开
-
数据挖掘经典算法之:K-means算法
一.K-means算法定义:K-Means 是一种基于距离的排他的聚类划分方法。上面的 K-Means 描述中包含了几个概念: 聚类(Clustering):K-Means 是一种聚类分析(Cluster Analysis)方法。聚类就是将数据对象分组成为多个类或者簇 (Cluster),使得在同一个簇中的对象之间具有较高的相似度,而不同簇中的对象差别较大。 划分(Part...原创 2018-08-04 15:02:16 · 1287 阅读 · 0 评论 -
数据挖掘经典算法之:C4.5算法
一.C4.5算法C4.5算法是对ID3算法的一种改进,所以,首先我们来看ID3算法。ID3算法是在决策树各个结点上应用信息增益准则来选择特征,递归地构建决策树。决策树:是一种基本的分类与回归方法,一种分类决策模型,是一种树形结构,该模型具有可读性,分类速度快的优点。决策树由结点(内部结点、叶结点)和有向边组成。内部结点表示特征或属性,叶结点表示类或结论。决策树如下图所示:其中圆点表示特...原创 2018-08-03 16:51:25 · 2216 阅读 · 0 评论