笔记(機器學習技法):Random Forest

Feature selection


这里写图片描述
permutation test的原理(随机排序的方式来测试某个特征的重要性):原本的表现-该特征数据的随机打乱后的表现。
在面对非线性的问题的时候会首先用Random Forest来进行初步的特征选择。

Random Forest in Action

这里写图片描述
上图一:一棵树划分情况,图二(bagging的小树的结果):bootstrap随机产生的一颗树的情况,此时有些点没有被抽样,图三(整个森林的结果):bootstrap随机产生多颗数的组合情况,边界更加平滑和具有最大边界性(边界处在圈圈与叉叉的中间位置)。
这里写图片描述
再有噪声的数据集中,较多的树的投票结果会尽量将噪声影响降到最小。
RF是一个随机演算的过程,若随机过程没有达到一个相对稳定的状态,或者对一点点变化很敏感,因而产生一些高高低低的变化,受到初始值的影响。通过考察增加一棵树减少一棵树的影响大不大来决定你的树数目够不够。
总结:RF是bagging和decision tree的结合

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值