【数据挖掘】第四章 分类与预测 4.3决策树分类方法

这节课我们来学习决策树分类方法,决策树模型的基本思想类似于我们生物学中的生物分类图,按照属性的取值进行样本划分,最终形成不同的类别。在大数据分析的过程中,如果想要对调研样本实现这样的分类图谱难不难呢?其实一点也不难,我们可以使用最简单的古典概率模型来设计决策树模型的算法。

本次课的主要内容主要包括以下三点,一,古典概型的基本理论,二,决策树分类预测方法,三,应用实例以及算法的pc3代码实现。

古典概率模型简称为古。古典概型的概率求解公式信息熵和熵的性质日常生活中可以见到很多古典概型的例子,如掷骰子,抛硬币,摸球游戏,买彩票等等,这些古典概型的案例,我们在学习概率论与数理统计这门课时都已经非常熟悉了。古典概型中设样本空间共有 n 个样本点,a 为事件,若 a 中含有 k 个样本点,那么事件 a 发生的概率就是 k 除以 a 。根据古典概型,我们可以进一步提炼信息商的概念。信息系统 x 的商定义为 hx 等于负的 cmmi 等于一到 mpui 乘以 log 以二为底的 pui 其中 pui 等于样本集合 ui 的样本点除以总样本点的个数,因为 pi 在零到一之间,因此 log 以二为底的 pi 是小于零的,因此商的公式前面加了负号,以保证信息商非负。我们举一个例子来说明商的计算,比如有32个足球队比赛,每一个队实力相当,那么每一个队胜出的概率是1/32,如果要猜出哪个足球队胜出,这个猜测事件的信息上是 hx 等于五。试想一下

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

人工智能lab

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值