机器学习笔记（五）决策树算法及实践

最新推荐文章于 2022-01-03 09:37:08 发布

王大宝的CD

最新推荐文章于 2022-01-03 09:37:08 发布

阅读量2.8k

点赞数 1

CC 4.0 BY-SA版权

分类专栏：机器学习文章标签：机器学习 python 算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sinat_22594309/article/details/59090895

决策树是机器学习中相当经典的一种算法，既可以用作分类，也可以用作回归，同时还适合做集成学习用于随机森林等等，今天就来好好介绍一下决策树算法。

首先，决策树的思想就是非常容易理解的。通俗地讲就是拿到一堆样本之后，我首先根据某个特征，将样本划分为几类，然后在划分的每一类中，又根据新的特征再划分为若干类，这样重复的进行下去，总会达到一个效果，就是所有的样本都有且有唯一一条规则与之对应，这样决策树的构建就完成了。书面地讲就是从一个根节点出发根据某一特征划分成若干个子节点，再根据某一特征递归地划分下去，直到所有的样本都包含在内。其中中间节点通常表示样本的某一特征或者属性，而最后的叶节点则表示某一个类。

决策树的思想是十分直观的，那么问题来了，怎么去选择划分的特征呢？之前无论是线性回归还是Logistic回归，我们都给出了损失函数，然后根据损失函数去优化，那么决策树的损失函数是什么呢？接下来我们就来回答这两个问题。

常用的决策树算法主要有以下三种：

1 ID3算法

2 C4.5算法

3 CART算法

这三种算法的区别就在于选择特征的标准，具体如下。

ID3算法采用信息增益作为选择特征的依据。为了度量一个随机变量的不确定度，我们给出了熵的定义

那如果随机变量中的某个特征已知，那么在已知该特征的情况下，该随机变量的熵也就是条件熵是

有了条件熵之后，我们就可以计算已知某特征对随机变量熵的下降，我们就把这个下降的熵称之为信息增益，即

最低0.47元/天解锁文章

200万优质内容无限畅学

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。