【数据挖掘】第四章分类与预测 4.3决策树分类方法

人工智能lab

已于 2023-10-05 19:10:39 修改

阅读量128

点赞数

分类专栏：数据挖掘文章标签：数据挖掘人工智能

于 2023-10-05 18:20:30 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xuepengfei123_/article/details/133582790

版权

这节课我们来学习决策树分类方法，决策树模型的基本思想类似于我们生物学中的生物分类图，按照属性的取值进行样本划分，最终形成不同的类别。在大数据分析的过程中，如果想要对调研样本实现这样的分类图谱难不难呢？其实一点也不难，我们可以使用最简单的古典概率模型来设计决策树模型的算法。

本次课的主要内容主要包括以下三点，一，古典概型的基本理论，二，决策树分类预测方法，三，应用实例以及算法的pc3代码实现。

古典概率模型简称为古。古典概型的概率求解公式信息熵和熵的性质日常生活中可以见到很多古典概型的例子，如掷骰子，抛硬币，摸球游戏，买彩票等等，这些古典概型的案例，我们在学习概率论与数理统计这门课时都已经非常熟悉了。古典概型中设样本空间共有 n 个样本点，a 为事件，若 a 中含有 k 个样本点，那么事件 a 发生的概率就是 k 除以 a 。根据古典概型，我们可以进一步提炼信息商的概念。信息系统 x 的商定义为 hx 等于负的 cmmi 等于一到 mpui 乘以 log 以二为底的 pui 其中 pui 等于样本集合 ui 的样本点除以总样本点的个数，因为 pi 在零到一之间，因此 log 以二为底的 pi 是小于零的，因此商的公式前面加了负号，以保证信息商非负。我们举一个例子来说明商的计算，比如有32个足球队比赛，每一个队实力相当，那么每一个队胜出的概率是1/32，如果要猜出哪个足球队胜出，这个猜测事件的信息上是 hx 等于五。试想一下

最低0.47元/天解锁文章

人工智能lab

博客等级

码龄2年

15
原创

1
点赞

0
收藏

0
粉丝

关注

私信

热门文章

分类专栏

数据挖掘 15篇

最新评论

【数据挖掘】第四章分类与预测 4.7 分类与预测算法的性能评价方法
CSDN-Ada助手: 恭喜您写完了第14篇博客！标题看起来很有意思，我相信这篇博客对于数据挖掘领域的分类与预测算法的性能评价方法会提供很多有价值的知识。您的持续创作让我非常钦佩，不仅展示了您对该领域的深入理解，还帮助了读者更好地理解相关概念和方法。作为下一步的创作建议，或许您可以考虑在博客中添加一些实际案例或者应用场景，以便读者更好地将这些分类与预测算法的性能评价方法运用到实际问题中。此外，分享一些您个人的经验和见解，将使您的博客更具独特性和吸引力。我非常期待您未来更多的博客，希望您能继续保持谦虚的态度，并将您的知识和见解与读者们分享。加油！
【数据挖掘】第一章绪论 1.1节数据挖掘的概念和任务
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天最佳新人】榜单，全部的排名请看 https://bbs.csdn.net/topics/617364742。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

人工智能lab 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。