决策树原理-九五小庞

树模型

  • 决策树:从根节点开始一步步走到叶子节点(决策)
  • 所有的数据都会落到叶子节点,既可以做分类也可以做回归
    在这里插入图片描述

如何切分特征(选择节点)

  • 问题:根节点的选择该用那个特征?如何进行切分?
  • 目标:通过一种衡量标准,来计算通过不同特征进行分支选择后的分类情况,找出来最好的那个当成根节点,以此类推。

衡量标准-熵

  • 熵:熵是随机变量不确定性的度量(解释:说白了就是物体内部的混乱程度,比如杂货市场里面什么都有,那肯定混乱,专卖店只卖一个牌子的那就稳定多了)
    在这里插入图片描述

信息增益

  • 熵:不确定性越大,得到的熵值也就越大
    当p=0或p=1时,H§=0,随机变量完全没有不确定性
    当p=0.5时,H§=1,此时随机变量的不确定性最大

  • 如何决策一个节点的选择呢?
    在这里插入图片描述

  • 信息增益:表示特征X使得类Y的不确定性减少的程度。(分类后的专一性,希望分类后的结果是同类在一起)

决策树构造实例

在这里插入图片描述

决策树剪枝策略

  • 为什么要剪枝:决策树过拟合风险很大,理论上可以完全分得开数据(想象一下,如果树足够庞大,每个叶子节点不就一个数据了嘛)
  • 剪枝策略:预剪枝,后剪枝
  • 预剪枝:边建立决策树边进行剪枝的操作(更实用)
  • 后剪枝:当建立完决策树后来进行剪枝操作
  • 预剪枝:限制深度,叶子节点个数 叶子节点样本数,信息增益量等
  • 后剪枝:通过一定的衡量标准
    在这里插入图片描述
    在这里插入图片描述

回归问题解决

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值