机器学习第八周打卡:决策树

决策树的本质:本质是从训练数据中,总结出一套分类规则,也可以理解为训练处一套条件概率模型。本质上的思路,是和逻辑回归不一样的。
决策树建立的过程是:
1、特征选择
2、决策树的生成
3、决策树的剪纸

在特征选择上,核心思想就是,选择一个最好的维度,确定最好的阈值。两个最好要如何确定,是个重要问题。
如何选择呢?在候选特征中找出信息增益高于平均水平的特征,然后在这些特征中再选择信息增益率最高的特征(防止发生过拟合)。
什么是信息增益?就是经过某特征划分后的信息熵-未划分前的信息熵。信息增益越高,有可能发生过拟合。
在这里插入图片描述
什么是信息增益率?
在这里插入图片描述
具体代码看链接:
https://mp.weixin.qq.com/s?__biz=MzI4MjkzNTUxMw==&mid=2247484204&idx=1&sn=372d3ee90802d15347445f91056fe6bc&chksm=eb932a9adce4a38c9750a2cf6ca3382056b66099476223da02016e964ef711b97c4798ba9e58&scene=21#wechat_redirect

决策树的生成:C3.0和C4.5算法

决策树的剪枝

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值