数据挖掘
文章平均质量分 79
susandebug
keep moving
展开
-
ID3算法
原文转自:http://blog.sina.com.cn /s/blog_6e85bf420100ohma.html转载 2014-09-13 21:28:56 · 578 阅读 · 0 评论 -
C4.5算法详解(至今见过写的最好的算法详解)
C4.5是机器学习算法中的另一个分类决策树算法,它是基于ID3算法进行改进后的一种重要算法,相比于ID3算法,改进有如下几个要点: 用信息增益率来选择属性。ID3选择属性用的是子树的信息增益,这里可以用很多方法来定义信息,ID3使用的是熵(entropy, 熵是一种不纯度度量准则),也就是熵的变化值,而C4.5用的是信息增益率。 在决策树构造过程中进行剪枝,因为某些具有很少元素的结点可转载 2014-09-13 23:18:55 · 1011 阅读 · 0 评论 -
2-3树—检索数据类型
在2-3树中,每个内部节点(非叶子节点)有两个或三个孩子,而且所有叶子都在同一级别上。例如,图1显示高度为3的2-3树。包含两个孩子的节点称为2-节点,二叉树中的节点都是2-节点;包含三个孩子的节点称为3-节点。转载 2015-07-11 11:30:39 · 518 阅读 · 0 评论