ML算法——随机森林

1、套袋法Bagging

在这里插入图片描述
Bagging的弱学习器之间没有boosting那样的联系,它的特点是随机采样,一般是自主采样法(Bootstrap sampling):从训练集中裁剪固定个数的样本,但每采集一个样本后,都将样本放回。
(1) 从原始样本集中有放回的随机抽取n个训练样本,独立进行k轮抽取,得到k个训练集
(2) 独立训练k个模型(基学习器可以是:决策树、神经网络等)
(3) 分类问题: 投票法; 回归问题:取k个模型预测结果的均值
(4) 预测函数可以并行生成

1.1 袋外数据

  • 对于一个样本,在m个样本的数据集中随机采样,每次被抽取到的概率是 1 m \frac{1}{m} m1,每次没有被抽取到的概率是 ( 1 − 1 m ) (1-\frac{1}{m}) (1m1), 那么抽了m次都没被抽到的概率是 ( 1 − 1 m ) m (1-\frac{1}{m})^m (1m1)m
  • m → ∞ m\rightarrow \infty m时, ( 1 − 1 m ) m → 1 e ≈ 0.368 (1-\frac{1}{m})^m\rightarrow \frac{1}{e}\approx0.368 (1m1)me10.368, 也就是说,在bagging的每轮随机采样中,都有大约36.8%的样本没有被抽取到。
  • 对于这部分大约36.8%的没有被采样到的数据,称为袋外数据(Out Of Bag),由于没有参与到训练,故可以用来检测模型的泛化能力

1.2 Bagging减少方差增大偏差

2、随机森林

Bagging + 决策树 = 随机森林

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值