ML算法——随机森林

最新推荐文章于 2024-07-25 23:00:07 发布

美式半糖不加奶

最新推荐文章于 2024-07-25 23:00:07 发布

阅读量219

点赞数

分类专栏：机器学习文章标签：决策树机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/kissedbywater/article/details/105061319

版权

机器学习专栏收录该内容

2 篇文章 0 订阅

订阅专栏

文章目录

1、套袋法Bagging
- 1.1 袋外数据
- 1.2 Bagging减少方差增大偏差
2、随机森林
- Bagging + 决策树 = 随机森林

1、套袋法Bagging

在这里插入图片描述
Bagging的弱学习器之间没有boosting那样的联系，它的特点是随机采样，一般是自主采样法(Bootstrap sampling):从训练集中裁剪固定个数的样本，但每采集一个样本后，都将样本放回。
(1) 从原始样本集中有放回的随机抽取n个训练样本，独立进行k轮抽取，得到k个训练集
(2) 独立训练k个模型(基学习器可以是：决策树、神经网络等)
(3) 分类问题: 投票法；回归问题：取k个模型预测结果的均值
(4) 预测函数可以并行生成

1.1 袋外数据

对于一个样本，在m个样本的数据集中随机采样，每次被抽取到的概率是 $\frac{1}{m}$ ,每次没有被抽取到的概率是 $(1-\frac{1}{m})$ , 那么抽了m次都没被抽到的概率是 $(1-\frac{1}{m})^m$
当 $m\rightarrow \infty$ 时， $(1-\frac{1}{m})^m\rightarrow \frac{1}{e}\approx0.368$ , 也就是说，在bagging的每轮随机采样中，都有大约36.8%的样本没有被抽取到。
对于这部分大约36.8%的没有被采样到的数据，称为袋外数据(Out Of Bag),由于没有参与到训练，故可以用来检测模型的泛化能力

1.2 Bagging减少方差增大偏差

2、随机森林

Bagging + 决策树 = 随机森林

美式半糖不加奶

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
ML算法——随机森林

文章目录1、套袋法Bagging1.1 袋外数据1、套袋法BaggingBagging的弱学习器之间没有boosting那样的联系，它的特点是随机采样，一般是自主采样法(Bootstrap sampling):从训练集中裁剪固定个数的样本，但每采集一个样本后，都将样本放回。(1) 从原始样本集中有放回的随机抽取n个训练样本，独立进行k轮抽取，得到k个训练集(2) 独立训练k个模型(基学习...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。