随机森林(Random forest)的理解和复习

本文详细介绍了随机森林的分类过程,包括样本采样的Bagging方法、随机森林的随机性和其降低方差的原理。同时,探讨了随机森林的特点,如OOB验证和特征重要性的计算。此外,还讨论了随机森林在训练和工程实践中的优点,如并行训练和防止过拟合。
摘要由CSDN通过智能技术生成

本文主要是对随机森林的复习,把随机森林知识结构化,温故而知新~

1、分类过程

样本采样方法:Bagging

1、Bagging过程(Bootstrapping集成)

  • 有放回的随机抽样

2、Voting过程(每个基学习器进行投票)

  • 针对回归:每个基学习器预测结果进行平均
  • 针对分类:每个基学习器预测结果进行投票,得票数最多的类为预测类

随机森林的随机性

1、样本的随机性(Bagging): 在Bagging时, 随机选择样本

2、特征的随机性(Random subspace): 在训练时,随机选取一部分特征,每一轮得到的树几乎都是由N个不同的特征构成的,每棵树都不一样,增大差异性

3、随机特征组合(Random combination): 在林轩田机器学习技法中, 提到了一种随机特征组合的方法。在每次分支中,将现有特征x,乘上一个数组p,进行线性组合构造新的特征:

ϕ i ( x ) = p i T x \phi_i(x) = p_i^Tx ϕi(x)=piTx

这种方法使每次分支得到的不再是单一的子特征集合,而是子特征的线性组合(权重不为1)。好比在二维平面上不止得到水平线和垂直线,也能得到各种斜线。值得注意的是,不同分支i下的 p i p_i pi 是不同的,而且向量 p i p_i p<

  • 2
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值