统计学习方法（第5章）决策树学习笔记

最新推荐文章于 2019-05-26 23:37:22 发布

pzp1011

最新推荐文章于 2019-05-26 23:37:22 发布

阅读量366

点赞数

分类专栏：统计学习方法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/pzp1011/article/details/80016462

版权

本文详细介绍了决策树的学习方法，包括决策树模型、特征选择的标准如信息增益和信息增益比，以及CART算法的基尼指数。决策树生成过程涉及选择信息增益最大的特征，并通过C4.5和CART算法进行二叉树划分。此外，还提及了决策树的剪枝策略。

摘要由CSDN通过智能技术生成

第5章决策树

　　决策树是一种基本的分类与回归方法。这章主要讨论用于分类的决策树，也就是基于特征对实例进行分类的决策树。决策树通常包括3个步骤：特征选择、决策树的生成、决策树的修剪。

5.1 决策树模型

　　分类决策树模型是一种描述对实例进行分类的树形结构，内部节点表示一个特征或属性，叶子节点表示一个类。它可以认为是if-then规则的集合，也可以是定义在特征空间与类空间上的条件概率。

　　

　　决策树的本质上是从训练数据集中归纳出一组分类规则。我们需要的是一个与训练数据矛盾较小的决策树，同时具有很好的泛华能力。决策树学习用损失函数表示这一目标。其损失函数通常是正则化的极大似然函数。决策树学习的策略是以损失函数为目标函数的最小化。

　　如果特征数量很多，也可以在决策树学习开始的时候，对特征进行选择，只留下对训练数据有足够分类能力的特征。

5.2 特征选择

　　直观上，如果一个特征具有更好的分类能力，或者说，按照这一特征将训练数据集分割成子集，是的各个子集在当前条件下有最好的分类，则就更应该选择这个特征。信息增益就能够很好地表示这一直观的准则。　　

　　特征选择的准则是信息增益或信息增益比。

最低0.47元/天解锁文章

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。