MF2 - Decision Tree

优点
  • 便于可视化展示
特征选择
  • 选择依据:熵值大小的减少程度
    在这里插入图片描述
  • 熵的解释
  • 信息增益:熵值大小的减少程度
选择算法
  • ID3算法: 循环遍历每一个特征确认后的信息增益,然后选出增益最大的
    • 缺点是id这种特征无法处理
  • C4.5 信息增益率:处理id这种特征,采用的方法是=信息增益/自身的熵值
    • 因为id这种特征自身的熵值是非常大的
  • CART:采用GINI系数
    在这里插入图片描述
如果特征不是离散值而是连续值,可以采用二分法,人为分开
剪枝策略
  • 当特征过多,防止过拟合的问题,可以去掉一些多余的特征
  • 分为两种方式
    • 预剪枝:边建立决策树边进行剪枝的操作(更实用)
      • 方法::限制深度,叶子节点个数 叶子节点样本数,信息增益量等
    • 后剪枝:当建立完决策树后来进行剪枝操作
      • 在这里插入图片描述
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值