机器学习入门--03决策树

本文概述了决策树学习的目标——生成具有强泛化能力的决策树,介绍了遵循分而治之策略的基本流程。讨论了导致递归终止的三种情况,信息增益的重要性,以及CART算法的应用。同时,提到了剪枝作为对抗过拟合的关键手段。
摘要由CSDN通过智能技术生成

1、决策树学习的目的是为了产生一棵泛化能力强,即处理未见示例能力强的决策树,其基本流程遵循简单且直观的"分而治之" (divide-and-conquer) 策略。

2、三种情形会导致递归返回:
(1) 当前结点包含的样本全属于同一类别,无需划分;
(2) 当前属性集为空,或是所有样本在所有属性上取值相同,无法划分;
(3) 当前结点包含的样本集合为空,不能划分。

3、一般而言,信息增益越大,则意味着使周属性 来进行划分所获得的"纯度提升"越大。

4、增益率准则对可取值数目较少的属性有所偏好。

5、CART Classification and Regression Tr.胆的简称,这是一种著名的决策树学习算法,分类和回归任务都可用。

6、剪枝(pruning) 是决策树学习算法对付"过拟合"的主要手段。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值