决策树的学习(Decision Tree)

1.对于决策树的概念:

**本质上:**决策树就是模拟树的结构基于 if-else的多层判断
在这里插入图片描述

2.目的:
对实例进行分类的树形结构,通过多层判断,将所提供的数据归纳为一种分类规则
3.优点:
1.计算量小,无需考虑损失函数,运行速度快
2.便于理解
4.缺点:
1.忽略了属性之间的相关性,比如我们的逻辑回归,sigmod函数它考虑了属性之间的相关性,比如是否具有学习兴趣,可能学习动力和学习时间是有一定的关联的,逻辑回归就考虑了相关性,但是决策树就没有考虑。
2.样本类别分布不均匀时,容易影响模型的表现。

2.例子:

根据特征进行判断,不同特征决定了不同的决策树;
在这里插入图片描述

2.1 ID3算法的学习

在这里插入图片描述

2.2 . 信息熵的概念:

1.决策树的难点在于找到最合适的属性作为我们所判断的信息
2.最合适的判断:在于信息熵,熵越大说明信息的不确定性就越大,而信息熵跟我们的信息增益是直接相关的,信息熵越小,信息增益就越大;
在这里插入图片描述
2.信息增益的概念:
信息熵尽可能小,那么我们Gain(D,a)所获取的信息增益就更大。
类别越少,Dv/D就越小,信息增益就越大
在这里插入图片描述

2.2 选择哪个属性作为我们的类别:

计算信息增益最大的属性作为我们的第一个节点:
在这里插入图片描述
在这里插入图片描述
决策树展示:
在这里插入图片描述

  • 7
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Fairy要carry

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值