吃瓜教程task03

决策树

浅浅阅读了西瓜书和南瓜书第四章,总结了以下几点。

  • 决策树,本质上就是依据属性值判定分类,决策树机器学习的目的是为了产生一个泛化能力更强的决策树。
  • 决策树学习的关键是如何选择最优划分属性,以此保证该属性下的样本尽可能属于同一类别,即纯度越来越高。
  • 度量样本集合纯度最常用的一种指标是“信息熵”,由信息熵计算出“信息增益”,信息增益越大,表明使用该属性进行划分的纯度越大,但是,信息增益存在弊端,我们常用“增益率”来选择最优划分属性。
  • 剪枝是为了应对“过拟合”问题,基本策略是“预剪枝”和“后剪枝”,预剪枝是对每个结点在划分前先进行估计,后剪枝是在决策树生成之后,自底向上地对非叶节点进行考察。
  • 决策树不仅适用于离散属性,也适用于连续属性,最简单的策略是采用二分法处理连续属性。
  • 决策树的每个属性可以看作是一个坐标轴,决策树又可看作是找到不同样本之间的边界。多变量决策树,是对属性的线性组合进行测试,而不再仅仅是某个属性。
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值