机器学习笔记第十章

机器学习笔记第十章

在这里插入图片描述

决策树:非参数的学习算法,可以解决分类问题,天然解决多分类问题,也可以解决回归的问题,具有非常好的可解释性。

问题:每个节点在哪个维度上做划分?某个维度在哪个值上做划分?

信息熵:

熵在信息论中代表随机变量不确定度的度量

熵越大,数据的不确定性越高

熵越小,数据的不确定性越低

在这里插入图片描述

例子:

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

使用信息熵寻找最优划分

基尼系数

在这里插入图片描述

例子:
在这里插入图片描述
特例:
在这里插入图片描述

信息熵 vs 基尼系数

在这里插入图片描述

CART与决策树中的超参数

Classification and Regression Tree

根据某个维度d和某个阈值v进行二分

scikit-learn的决策树实现方法CART

复杂度:

在这里插入图片描述

决策树解决回归的问题

vote
使用投票来决定

决策树的局限性

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值