机器学习——集成学习算法的理解

最新推荐文章于 2023-02-28 19:37:05 发布

Nicole_Li1095

最新推荐文章于 2023-02-28 19:37:05 发布

阅读量185

点赞数

文章标签：数据结构与算法人工智能

原文链接：http://www.cnblogs.com/HL-blog/p/8857700.html

版权

集成学习是一种把多个个体学习器（弱学习器）组成一个强学习器的算法。可以把它当做一种优化策略。

个体学习器：实际是一种机器学习的算法训练的模型，如：决策树，支持向量机，神经网络等。

弱学习器：准确率略高于随机猜测的个体学习器。比如在二分类问题上：男和女。随机猜测正确的概率为50%,而弱学习器的准确率略高于50%。

多个同样算法的个体学习器的组合叫做同质。

如果其中还包含的算法，如同时有决策树和支持向量称为异质。

现在通常使用的是同质的集成学习。

集成学习按照算法划分最常见的有两种 bagging和boosting

bagging:一种简单采用投票和求平均值的方法。一般对数据集，采用随机抽样放回方法，分成T份数据。利用每份数据，对个体学习器进行训练。最后得到T个体学习器。

　　　　然后把T个学习器组合在一起：分类问题：采用投票的方式，多个学习器都对数据X进行预测，哪个答案最多，就采用哪个。

　　　　　　　　　　　　　　　　　回归问题：采用求平均值的方式，求多个个体学习器预测结果的平均值。

boosting: 一种不断减少模型误差的方法。首先一个模型对训练数据进行预测，对预测错误的样本赋予更高的权值。然后再一次训练模型进行预测，重点关注那些高权值预测

　　　　　错误的样本。如此循环，直到个体学习器的数量达到T个。分类问题：T个个体学习器进行加权投票。最先训练学习器的权值低，最后的权值高。

　　　　　　　　　　　　　　　　　　　　　　　　　　　　　　回归问题：采用加权求平均值的方法。

转载于:https://www.cnblogs.com/HL-blog/p/8857700.html

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习——集成学习算法的理解

集成学习是一种把多个个体学习器（弱学习器）组成一个强学习器的算法。可以把它当做一种优化策略。个体学习器：实际是一种机器学习的算法训练的模型，如：决策树，支持向量机，神经网络等。弱学习器：准确率略高于随机猜测的个体学习器。比如在二分类问题上：男和女。随机猜测正确的概率为50%,而弱学习器的准确率略高于50%。多个同样算法的个体学习器的组合叫做同质。如果其中还包含的...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。