随机森林学习总结

最新推荐文章于 2024-07-24 16:17:58 发布

JERRYFY007

最新推荐文章于 2024-07-24 16:17:58 发布

阅读量2.3k

点赞数 1

分类专栏：历史博客

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/JERRYFY007/article/details/78169122

版权

本文详细介绍了决策树的三种构建算法：ID3、C4.5和CART，包括各自的分裂依据、处理连续数据的方式以及剪枝策略。接着，文章深入探讨了随机森林的概念、训练过程、预测过程及其特点，阐述了随机森林与GBDT、xgboost的区别。

摘要由CSDN通过智能技术生成

1.决策树

决策树：从根节点开始一步步走到叶子节点(决策)，所有的数据最终都会落在叶子节点，既可以做分类也可以做回归。根据决策树的输出结果，决策树可以分为分类树和回归树，分类树输出的结果为离散值(具体的类别)，而回归树输出的结果为连续值(一个确定的数值)。决策树的构建算法主要有三种ID3，C4.5，CART三种，其中ID3和C4.5是分类树，CART是分类回归树，ID3是决策树最基本的构建算法，而C4.5和CART是在ID3的基础上进行优化的算法。下面介绍常见的三种决策树算法。

1.1 ID3

(1)熵熵是表示随机变量不确定性的度量，直观理解是物体内部的混乱程度。公式如下：

其实就是随机变量的自信息量I(x)的数学期望。

(2)信息增益

其中C为类别，这个变量可能的取值为C1，C2... Cn， T为特征。信息增益可以理解为先验熵(系统原本的熵)与固定特征T之后的条件熵之差。

(3)决策树的构建

数据分割。对于离散型数据，直接按照离散数据的取值进行分裂，每一个取值对应一个子节点。对于连续型数据，ID3原本是没有能力处理的，只有通过离散化将连续性数据转化为离散型数据再进行处理。

选择最优分裂属性。ID3采用信息增益作为选择最优的分裂属性的方法，选择熵作为衡量节点纯度的标准，信息增益的公式如上，分别计算每一个属性的信息增益，选择信息增益最大的属性进行分裂。

停止分裂的条件。①最小节点数，当节点的数据量小于一个指定的数量时，不继续分裂。为了防止噪声的影响和降低复杂度，有利于降低过拟合的影响。②熵或者基尼值小于阀值。熵和基尼值的大小表示数据的复杂程度，当熵或者基尼值过小时，表示数据的纯度比较大，如果熵或者基尼值小于一定程度时，节点停止分裂。③决策树的深度达到指定的条件。④所有特征已经使用完毕，不能继续进行分裂。

(4)总结

最低0.47元/天解锁文章

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

JERRYFY007 CSDN认证博客专家 CSDN认证企业博客

码龄9年

33: 原创

16万+: 周排名

216万+: 总排名

2万+: 访问

: 等级

535: 积分

3: 粉丝

9: 获赞

8: 评论

5: 收藏

私信

关注

热门文章

分类专栏

最新评论

使用Windows版CRF++时import CRFPP出错解决过程
qq_39674559: 楼主上面的文件有没有具体复制的路径，比如crfpp.h复制到哪里去
使用Windows版CRF++时import CRFPP出错解决过程
qq_26103019: 楼主好想问下下载了crf++ win32包后怎么使用python安装呢？？文件里没有python子目录啊
使用Windows版CRF++时import CRFPP出错解决过程
kill 回复 JERRYFY007: 大哥，又报错了。DLL相关的错误。麻烦把生成的CRFPP相关的文件都发我下吧。万分感谢。
使用Windows版CRF++时import CRFPP出错解决过程
JERRYFY007 回复 kill: 链接：https://pan.baidu.com/s/1c3acNjq 密码：daxp 你试试这个行不行，注意这个文件的存放路径，放在Anaconda2_32bit\lib\site-packages\下,这是Anaconda2的安装目录，如果不行，你再仔细试下上面的流程吧，结合其他网友的评论。
使用Windows版CRF++时import CRFPP出错解决过程
kill 回复 devilye3: 请问可以发一下_CRFPP文件吗？我编译失败。提示el.exe缺失，搞了一周了。谢谢：liushaohan01@126.com

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。