RandomForest随机森林入门

1.随机森林中的随机的概念解释:

    随机体现在模型中就是对行和列进行随机的选取

  • 行: 随机选取部分样本
  • 列:随机选取本分特征
  • 这两个条件保证了避免过拟合的发生

2.随机森林是有很多颗决策树组成的.每一颗决策树都是强分类器,每一个分类器都是对部分数据的一个"精准"预测器,因此需要将很多颗决策树进行汇集,最后得到答案.

对于数字类型的答案:比较常见的手法是求多颗决策树预测结果的平均值

对于分类的答案:比较常见的手法是进行投票

3.随机森林自带bagging属性 boostrap aggregation

4.High bias是模型欠拟合,导致误差较大 model过于简单

    high variance是因为模型过拟合,记住了太多的异常值和噪声,

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值