数据挖掘十大经典算法学习之C4.5决策树分类算法及信息熵相关

最新推荐文章于 2020-12-11 21:33:34 发布

vshadow

最新推荐文章于 2020-12-11 21:33:34 发布

阅读量1.3w

点赞数 4

分类专栏：数据挖掘学习笔记文章标签：数据挖掘算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/vshadow/article/details/8241283

版权

本文介绍了决策树学习算法中的C4.5，它是数据挖掘的重要方法，具备对噪声数据的健壮性。文章讨论了如何构建决策树，以信息增益作为选取属性的标准，通过熵的概念衡量属性区分样本的能力。通过实例展示了如何计算信息增益，以确定最佳根节点属性。

摘要由CSDN通过智能技术生成

Definition

决策树学习时应用最广的归纳推理算法之一。[1]它是一种逼近离散值函数的方法，对噪声数据有很好的健壮性且能够学习析取表达式。CLS， ID3，C4.5，CART均是决策树学习算法。

[1]归纳学习成立存在一个基本假设：任一假设如果在足够大的训练样例集中很好地逼近目标函数，它也能在未见实例中很好地逼近目标函数。“泛化能力”

决策树学习的归纳偏置是优先选择较小的树。

决策树通过把实例从根节点排列到某个叶子节点来分类实例，叶子节点即为实例所属的分类。树上的每一个结点指定了对实例的某个属性的测试，并且该结点的每一个后继分支对应于该属性的一个可能值。分类实例的方法是从这个树的根结点开始，测试这个结点指定的属性，然后按照给定实例的该属性值对应的树枝向下移动。然后这个过程在以新结点为根的子树上重复。

表-1为根据天气情况判断是否适合出去玩的数据集。

表-1

	Outlook	Temperature	Humidity	Windy	Play
1	sunny	hot	high	FALSE	no
2	sunny	hot	high	TRUE	no
3	overcast	hot	high	FALSE	yes
4	rainy	mild	high	FALSE	yes
5	rainy	cool	normal	FALSE	yes
6	rainy	cool	normal	TRUE	no
7	overcast	cool	normal	TRUE	yes
8	sunny	mild	high	FALSE	no
9	sunny	cool	normal	FALSE	yes
10	rainy	mild	normal	FALSE	yes
11	sunny	mild	normal	TRUE	yes
12	overcast	mild	high	TRUE	yes
13	overcast	hot	normal	FALSE

最低0.47元/天解锁文章

关注

4
点赞
踩
9

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

vshadow CSDN认证博客专家 CSDN认证企业博客

码龄16年

33: 原创

24万+: 周排名

89万+: 总排名

14万+: 访问

: 等级

1536: 积分

29: 粉丝

23: 获赞

13: 评论

31: 收藏

私信

关注

热门文章

分类专栏

最新评论

java - try with resource
CSDN-Ada助手: 非常感谢CSDN博主的分享，这篇博客介绍了java中的try with resource用法，对于我们开发人员来说非常实用。我觉得博主可以继续写一篇关于Java异常处理的文章，介绍一下常见的异常类型和处理方式，这样的技术文章对其他Java开发者会非常有帮助。下一篇你可以继续就Java异常处理方面的知识点展开，相信会有更多读者受益。加油！为了方便博主创作，提高生产力，CSDN上线了AI写作助手功能，就在创作编辑器右侧哦～（https://mp.csdn.net/edit?utm_source=blog_comment_recall ）诚邀您来加入测评，到此（https://activity.csdn.net/creatActivity?id=10450&utm_source=blog_comment_recall）发布测评文章即可获得「话题勋章」，同时还有机会拿定制奖牌。
c50 code called exit with value 1
Laura0226: 您好，我的数据明明没有空值为什么还是不行？我看别人说C50不能用字符型的factor，是因为这个原因吗？
数据挖掘十大经典算法学习之Adaboost自适应增强学习算法
Chris Mend: 刘兵老师
数据挖掘十大经典算法学习之C4.5决策树分类算法及信息熵相关
echowong2012 回复 cuixuange: 一样可以做的，但是算式要稍微换一下。看有本叫《数据挖掘》的书，封面是一堆石头中间有点金色。里面有详细介绍。
数据挖掘十大经典算法学习之C4.5决策树分类算法及信息熵相关
cuixuange: 如果类别的标签属性不止yes、no则呢么解决？

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。