树模型-随机森林RF

树模型

1、决策树 ID3,C4.5,CART
2、随机森林RF
3、Adaboost
4、GBDT
5、XGboost
6、孤立森林(异常检测)

二、随机森林RF

一、集成学习

​ 集成学习通过构建多个学习器采用加权的方式来完成学习任务,类似于“三个臭皮匠顶个诸葛亮”的思想。当然多个学习器之间需要满足一定的条件,一般来讲,多个学习器同属于一种模型,比如决策树,线性模型,而不会交叉用多种模型。为了保证集成学习的有效性,多个弱分类器之间应该满足两个条件:

​ 1)准确性:即个体学习器要有一定的准确性,在训练集上正确率至少达到 0.5 才能有好的效果。

​ 2)多样性:即学习器之间要有一些差异,因为完全相同的几个学习器集成起来后完全没有任何效果。

目前,集成学习主要分为Bagging和Boosting两种方式,前者通过Booststrap Aggregation的重采样得到多组训练集,并行的训练基学习器。而后者是一种提升的思想,基学习器是串行执行的,下一个学习器会基于上一个学习的经验进行调整,学习器前后有依赖关系,多个学习器最终组合得到强学习器。

//集成学习的有效性说明:

二、随机森林

​ 随机森林是集成学习中Bagging方式的代表,其相对决策树的提高很重要的一点防止过拟合,主要通过以下两点来防止过拟合,这与深度学习中的Dropout(随机的丢失一些样本和特征)技术非常相似

​ 1)样本选择随机:Bootstrap Sampling

​ 2)特征选择随机:基学习器决策树的特征选择 log2d l o g 2 d

Bootstrap Sampling:是一种统计学上的抽样方法,该方法是这样执行的,对于有 m m 个样本的数据集 D ,进行 m m 次有放回采样得到数据集 D ,这样 D D D 的大小一致。有放回采样使得 D' D ′ 中有的样本重复出现,有的样本则没有出现,简单估计一下,某个样本在 m m 次采样中始终没被采到的概率为

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值