决策树与随机森林

最新推荐文章于 2023-09-03 08:00:00 发布

我没吐但是我秃了

最新推荐文章于 2023-09-03 08:00:00 发布

阅读量315

点赞数

分类专栏：机器学习文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_41009913/article/details/102604078

版权

决策树模型

简介

决策树算法在机器学习中算是很经典的一个算法系列了。它既可以作为分类算法，也可以作为回归算法，同时也特别适合集成学习比如随机森林。决策树的学习通常包括3个步骤：特征选择、决策树的生成和决策树的修剪。决策树算法：ID3（利用信息增益对特征做选择）,C4.5（利用信息增益率对特征做选择）,CART（CART生成与CART剪枝）
在这里插入图片描述

ID3算法

ID3算法的特征选择与信息增益

特征选择在于选取对训练数据具有分类能力的特征，这样可以提高决策树的学习效率。特征选择是决定哪个特征来划分特征空间。
在这里插入图片描述
熵是度量了事物的不确定性，越不确定的事物熵就越高。越确定的事物概率也就越高，所以熵是和概率成反比，又要变成加法的形式，所以就在 $p_(x)$ 前加log并取负，就变成了信息量，再对信息量关于 $p_(x)$ 求期望,即为熵的表达式（我的理解是熵是各个权重信息量的和，权重即为他的概率表示在整体中的比例）。
表达式如下： $-\sum\limits_{i=1}^{n}p_i logp_i$
熵越大，随机变量的不确定性因素就越大。 $0<=H_(p)<log_(p)$
在这里插入图片描述
一个变量X的熵，很容易推广到多个个变量的联合熵，这里给出两个变量X和Y的联合熵表达式： $-\sum\limits_{i=1}^{n}p(x_i,y_i)logp(x_i,y_i)$

最低0.47元/天解锁文章

我没吐但是我秃了

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
决策树与随机森林

决策树模型简介决策树算法在机器学习中算是很经典的一个算法系列了。它既可以作为分类算法，也可以作为回归算法，同时也特别适合集成学习比如随机森林。决策树的学习通常包括3个步骤：特征选择、决策树的生成和决策树的修剪。决策树算法：ID3（利用信息增益对特征做选择）,C4.5（利用信息增益率对特征做选择）,CART（CART生成与CART剪枝）ID3算法ID3算法的特征选择与信息增益特征选择在于...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。