机器学习06:决策树学习

作者:非妃是公主
专栏:《机器学习》
个性签:顺境不惰,逆境不馁,以心制境,万事可成。——曾国藩
在这里插入图片描述

专栏地址

《机器学习》专栏地址

专栏系列文章

机器学习01:绪论

机器学习02:模型评估

机器学习03:线性回归与多分类学习

机器学习04:支持向量机

机器学习05:神经网络学习

机器学习06:决策树学习

机器学习07:贝叶斯学习

机器学习08:最近邻学习

机器学习09:无监督学习

机器学习10:集成学习

机器学习11:代价敏感学习

机器学习12:演化学习

决策树学习基本知识

在这里插入图片描述
在这里插入图片描述

决策树学习基本算法

在这里插入图片描述
上面是一个递归调用的过程

决策树学习常见问题

最佳划分的度量问题

在这里插入图片描述
在这里插入图片描述
选择能使熵最大减小的属性
在这里插入图片描述

结合图像理解三个指数

熵x ∈ \in [0, 1]:

在这里插入图片描述

基尼指数x ∈ \in [0, 1]:

在这里插入图片描述
做一条辅助线就会发现:越靠近中间,红色的线越长,说明我们熵是越大的
在这里插入图片描述

误分类率x ∈ \in [0, 1]:

在这里插入图片描述

在这里插入图片描述

C4.5决策树算法

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
从图像可以理解:属性分布越均匀,SplitInfo越大
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
加上下面六种统计信息增益度量的方法,一共存在9种
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
堂兄弟姐妹类型可以不同
在这里插入图片描述
在这里插入图片描述

处理确实属性值问题

在这里插入图片描述
在这里插入图片描述

处理连续属性值问题

离散化
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

叶子结点判定问题

在这里插入图片描述

怎样解决过拟合问题

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

待测样本分类问题

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

决策树学习理解解释

在这里插入图片描述
决策树表达为析取表达式(可解释性):
在这里插入图片描述

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Cherries Man

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值