机器学习——集成学习算法的理解

集成学习是一种把多个 个体学习器(弱学习器)组成一个强学习器的算法。可以把它当做一种优化策略。

个体学习器:实际是一种机器学习的算法训练的模型,如:决策树,支持向量机,神经网络 等。

弱学习器:准确率略高于随机猜测的个体学习器。比如在二分类问题上:男和女。随机猜测正确的概率为50%,而弱学习器的准确率 略高于50%。

多个同样算法的个体学习器 的组合 叫做同质。

如果其中还包含的算法,如同时有 决策树和 支持向量 称为 异质。

现在通常使用的是同质的 集成学习。

集成学习按照算法划分 最常见的有两种  bagging和boosting

bagging:一种简单采用投票和求平均值的方法。一般对数据集,采用随机抽样放回方法,分成T份数据。利用每份数据,对个体学习器进行训练。最后得到T个体学习器。

    然后把T个学习器组合在一起:分类问题:采用投票的方式,多个学习器都对数据X进行预测,哪个答案最多,就采用哪个。

                   回归问题:采用求平均值的方式,求多个个体学习器预测结果的平均值。

boosting: 一种不断减少模型误差的方法。首先一个模型对训练数据进行预测,对预测错误的样本赋予更高的权值。然后再一次训练模型进行预测,重点关注那些 高权值预测

     错误的样本。如此循环,直到个体学习器的数量达到T个。分类问题:T个 个体学习器进行加权投票。最先训练学习器的权值低,最后的权值高。

                                回归问题:采用加权求平均值的方法。

 

转载于:https://www.cnblogs.com/HL-blog/p/8857700.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值