随机森林

最新推荐文章于 2023-04-19 00:15:36 发布

wrany

最新推荐文章于 2023-04-19 00:15:36 发布

阅读量981

点赞数

分类专栏：秋招准备

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_38824043/article/details/106679852

版权

目录

随机森林概念

随机森林分类效果的影响因素

随机森林的优缺点

随机森林概念

随机森林属于集成学习的一种。

集成学习：通过构建并结合多个分类器，完成学习任务。期待状态，不同分类器‘和而不同’。主要有两类方法，a 个体学习器之间存在强依赖关系，需串行生成的序列化方法。代表算法 Boosting b 个体学习器间不存在强依赖关系，可同时生成的并行化方法。代表算法 Bagging 和随机森林

Bagging

步骤：

（1）给定包含m个样本的训练集，随机抽取一个样本放入采样集后放回，重复m次，得到一个含m个样本的采样集。

（2）以（1）的方法采样出T个采样集

（3）基于每个采样集训练出一个基学习器

（4）T个基学习器结合

特点：

Bagging主要关注降低方差

随机森林

概念：属于Bagging的一个拓展变体。以决策树为基学习器构建Bagging集成的基础上，进一步在决策树训练过程中引入随机属性选择。（解决了决策树泛化能力弱的问题）

具体方法：

相较传统决策树划分属性时在当前节点的属性集合里选择最优的特征。在随机森林里，对于基决策树的每个节点，先该节点的属性集合中选包含k个的子集，然后在该子集中选择最优属性用于划分。

当k=d，则基决策树的构建与传统决策树构建相同

当k=1，则基决策树构建是随机选择一个属性进行划分

通常情况下 k 取

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。