数据挖掘十大经典算法学习之C4.5决策树分类算法及信息熵相关

最新推荐文章于 2024-06-18 15:40:50 发布

vshadow

最新推荐文章于 2024-06-18 15:40:50 发布

阅读量1.3w

点赞数 4

分类专栏：数据挖掘学习笔记文章标签：数据挖掘算法

本文链接：https://blog.csdn.net/vshadow/article/details/8241283

版权

Definition

决策树学习时应用最广的归纳推理算法之一。[1]它是一种逼近离散值函数的方法，对噪声数据有很好的健壮性且能够学习析取表达式。CLS， ID3，C4.5，CART均是决策树学习算法。

[1]归纳学习成立存在一个基本假设：任一假设如果在足够大的训练样例集中很好地逼近目标函数，它也能在未见实例中很好地逼近目标函数。“泛化能力”

决策树学习的归纳偏置是优先选择较小的树。

决策树通过把实例从根节点排列到某个叶子节点来分类实例，叶子节点即为实例所属的分类。树上的每一个结点指定了对实例的某个属性的测试，并且该结点的每一个后继分支对应于该属性的一个可能值。分类实例的方法是从这个树的根结点开始，测试这个结点指定的属性，然后按照给定实例的该属性值对应的树枝向下移动。然后这个过程在以新结点为根的子树上重复。

表-1为根据天气情况判断是否适合出去玩的数据集。

表-1

	Outlook	Temperature	Humidity	Windy	Play
1	sunny	hot	high	FALSE	no
2	sunny	hot	high	TRUE	no
3	overcast	hot	high	FALSE	yes
4	rainy	mild	high	FALSE	yes
5	rainy	cool	normal	FALSE	yes
6	rainy	cool	normal	TRUE	no
7	overcast	cool	normal	TRUE	yes
8	sunny	mild	high	FALSE	no
9	sunny	cool	normal	FALSE	yes
10	rainy	mild	normal	FALSE	yes
11	sunny	mild	normal	TRUE	yes
12	overcast	mild	high	TRUE	yes
13	overcast	hot	normal	FALSE

最低0.47元/天解锁文章

vshadow

关注

4
点赞
踩
9

收藏

觉得还不错? 一键收藏
2
评论
数据挖掘十大经典算法学习之C4.5决策树分类算法及信息熵相关

Definition决策树学习时应用最广的归纳推理算法之一。[1]它是一种逼近离散值函数的方法，对噪声数据有很好的健壮性且能够学习析取表达式。CLS， ID3，C4.5，CART均是决策树学习算法。[1]归纳学习成立存在一个基本假设：任一假设如果在足够大的训练样例集中很好地逼近目标函数，它也能在未见实例中很好地逼近目标函数。“泛化能力”决策树学习的归纳偏置是优先选择较小的树。决策树
复制链接

扫一扫

专栏目录