机器学习面试-树模型

集成学习

Boosting:

串行方式训练基分类器, 各分类器之间有强依赖关系。基本思想是基分类器层层叠加, 每一层基分类器在训练的时候, 对前一层基分类器分错的样本给与更高的权重。 最后的结果由根据各层分类器的结果加权得到。

Bagging:

各分类器之间无依赖, 可以使用并行的方式。基本思想是, 各个个体分而治之, 独立作出判断, 在通过投票的方式,做出最后的决策。

偏差:

偏差是指由有所采样得到的大小为m的训练数据集,训练出的所有模型的输出的平均值和真实模型输出之间的偏差

方差:

所有采样得到的大小为m的训练数据集,训练出的所有模型的输出的方差

为什么选择决策树作为基分类器?

1. 可以方便的将样本的权重更新到训练过程中, 不需要使用过采样的方法来调节样本的权重。
2. 决策树的表达能力和泛化能力, 可以通过调节输的结构来控制
3. 数据样本的扰动对决策树影响较大, 不稳定的学习器更适合基分类器。

可否将随机森林的基分类器, 由决策树替换为线性分类器或者KNN?

不可以, 决策树的本质就是Bagging + CART, Bagging 的主要好处就是通过减小方差来提高模型的性能, 集成后的分类器, 比基分类器的方差

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值