机器学习基础：决策树

小羊和小何

已于 2022-05-24 12:55:39 修改

阅读量540

点赞数 1

分类专栏：机器学习基础文章标签：决策树机器学习学习

于 2022-05-24 12:54:24 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Abner98414/article/details/124936405

版权

目录

3. 从1-R到决策树

4. ID-3决策树

5. 决策树的分支条件——不纯度

6. 决策树的特征选择——信息增益

6.1 信息增益的缺陷

7. 决策树的特征选择——信息增益比

8. 决策树对于样本的预测

8.1 对于重复样本的预测

8.2 对于新样本的预测

9. 决策树的深度 & 性能

10. 关于ID-3决策树的讨论

1. Zero-R

$0-R$ 是一种常用的 $baseline$ ：

是通过对样本集合进行统计，然后选用出现频率最高的样本类作为对所有测试集样本预测的结果。

例如一个数据集包含三类样本，标签分别是：

A	1000
B	500
C	500

那么这个时候最多类是 $A$ ，占比是 $50%$ ，因此对于任何测试样本，这个 $0-R$ 模型的预测结果都是 $A$ ，而这个模型的正确率也就是 $50%$ 。

$0-R$ 模型不涉及任何特征的使用：

只有 $majority\: \: class$ 对于预测样本类别有用。

2. One-R

$1-R$ ：

只使用一组特征来构建模型并预测标签。

实际流程：

对于每个特征：

针对每个特征中所有不同的取值，计算这个取值的弱势标签数 $m$ 。

将所有取值的弱势标签数求和，除以所有的样本数 $n$ ，得到 $\frac{m}{n}$ 以这个特征构建 $0-R$ 时候的错误概率

比对每个特征的结果并选出拥有最高分类概率的特征作为标准，在测试集中进行样本预测。

例子：

对 $outlook$ 这个特征进行构建 $1-R$ 模型：

$sunny$ 中对于 $no$ 和 $yes$ 的数量分别是 $2,3$ ；所以对于 $sunny$ 来说，把 $no$ 标签看做是优势标签，而 $yes$ 标签被认为是弱势标签，因此 $sunny$ 的弱势样本数是 $2$ 个。

同理， $outlook$ 中的 $overcast$ 的弱势样本数是 $no$ ， $0$ 个； $rainy$ 的弱势样本是 $no$ ， $2$ 个。所以整个 $outlook$ 特征对于标签的错误率是 $\frac{4}{14}$ 。

再计算 $Temp$ 特征对于标签的错误率是 $\frac{2+2+1}{14}=\frac{5}{14}$ 。

综上： $Outlook$ 规则的表现优于 $Temp$ 。我们选 $Outlook$ 作为 $1-R$ 的特征。

再来看一个有更多特征的例子：

根据上面的结果，我们的 $1-R$ 模型会基于 $outlook$ 或者 $humidity$ 来构建。

我们把

最低0.47元/天解锁文章

小羊和小何

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
机器学习基础：决策树

ID-3的优点：在基本监督学习中受到高度评价；训练和分类速度快；高度可解释性。ID-3 的缺点：容易过拟合；容易受不相关特征的影响；偏爱nomial类型的特征。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。