- 这是上数据挖掘课准备的演示文稿,后面直接以图片的形式贴过来。
- C4.5概述
- C4.5是机器学习和数据挖掘领域解决分类问题的一套算法。
- 用来做有监督学习。给定一个属性值数据集,每个样本都是一系列属性值和所属类别,C4.5学习从属性值到类别标记的映射关系,用来对新的、未知的的样本做分类。
- 可以用来根据历史数据预测购买人群,或者通过历史战绩推测球赛的结果等。
- J.Ross Quinlan设计的C4.5算法源于名为ID3的一种决策树的诱导算法,ID3被称为“迭代分解器”系列算法的第三代。
- 决策树相当于将一系列问题组织成树,每一个问题相当于一个属性,根据属性值来生成判断分支,一直到决策树的叶节点,就产生了类别的预测结果。
- 关于决策树
- 决策树是对数据进行分类,以此达到预测的目的。
- 该决策树方法先根据训练集数据形成决策树,如果该树不能对所有对象给出正确的分类,那么选择一些例外加入到训练集数据中,重复该过程一直到形成正确的决策集。
- 决策树代表着决策集的树形结构。
- 决策树由决策结点、分支和叶子组成。
- 决策树中最上面的结点为根结点,每个分支是一个新的决策结点,或者是树的叶子。每个决策结点代表一个问题或决策,通常对应于待分类对象的属性。
- 每一个叶子结点代表一种可能的分类结果。
- 决策树实例
ID3算法
C4.5算法描述
- C4.5算法特征
- C4.5存在的问题及发展
C4.5决策树算法
最新推荐文章于 2023-02-20 15:09:34 发布