模型融合方法:Voting/Averaging、Stacking、Boosting和Bagging。

一般来说,通过融合多个不同的模型,可能提升机器学习的性能,这一方法在各种机器学习比赛中广泛应用,比如在kaggle上的otto产品分类挑战赛①中取得冠军和亚军成绩的模型都是融合了1000+模型的“庞然大物”。

        常见的集成学习&模型融合方法包括:简单的Voting/Averaging(分别对于分类和回归问题)、Stacking、Boosting和Bagging。

 

-->Voting/Averaging

        在不改变模型的情况下,直接对各个不同的模型预测的结果,进行投票或者平均,这是一种简单却行之有效的融合方式。

        比如对于分类问题,假设有三个相互独立的模型,每个正确率都是70%,采用少数服从多数的方式进行投票。那么最终的正确率将是:

                                                                      

 

        即结果经过简单的投票,使得正确率提升了8%。这是一个简单的概率学问题——如果进行投票的模型越多,那么显然其结果将会更好。但是其前提条件是模型之间相互独立,结果之间没有相关性。越相近的模型进行融合,融合效果也会越差。

模型之间差异越大,融合所得的结果将会更好。//这种特性不会受融合方式的影响。注意这里所指模型之间的差异,并不是指正确率的差异,而是指模型之间相关性的差异。

        对于回归问题,对各种模型的预测结果进行平均,所得到的结果通过能够减少过拟合,并使得边界更加平滑,单个模型的边界可能很粗糙。这是很直观的性质,随便放张图②就不另外详细举例了。

                                                                                                              

   在上述融合方法的基础上,一个进行改良的方式是对各个投票者/平均者分配不同的权重以改变其对最终结果影响的大小。对于正确率低的模型给予更低的权重,而正确率更高的模型给予更高的权重。这也是可以直观理解的——想要推翻专家模型(高正确率模型)的唯一方式,就是臭皮匠模型(低正确率模型)同时投出相同选项的反对票具体的对于权重的赋值,可以用正确率排名的正则化等。

        这种方法看似简单,但是却是下面各种“高级”方法的基础。


 

-->Boosting

        Boosting是一种将各种弱分类器串联起来的集成学习方式,每一个分类器的训练都依赖于前一个分类器的结果,顺序运行的方式导致了运行速度慢。和所有融合方式一样,它不会考虑各个弱分类器模型本身结构为何,而是对训练数据(样本集)和连接方式进行操纵以获得更小的误差。但是为了将最终的强分类器的误差均衡,之前所选取的分类器一般都是相对比较弱的分类器,因为一旦某个分类器较强将使得后续结果受到影响太大。所以多用于集成学习而非模型融合(将多个已经有较好效果的模型融合成更好的模型)。

        这里引用知乎专栏 《【机器学习】模型融合方法概述》③处引用

  • 4
    点赞
  • 34
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
周志华老师是机器学习领域的知名专家,他提出的集成学习思想是指通过组合多个学习器来提高整体的学习性能。其中,BaggingBoostingStacking是集成学习中最为常见的三种方法。 1. Baggingbootstrap aggregating):这是一种基于自助采样(bootstrap sampling)的集成学习方法,即从原始数据集中有放回地采样得到多个采样集,然后在每个采样集上训练一个基学习器,最后将这些基学习器的预测结果进行平均或投票等方式来得到最终结果。Bagging方法的优点是可以减小模型的方差,提高模型的泛化能力。 2. Boosting:这是一种基于加权多数表决(weighted majority voting)的集成学习方法,即在每次训练中对错分类的样本进行加权,使得基学习器对错分类的影响不同,最终将多个基学习器的预测结果进行加权平均来得到最终结果。Boosting方法的优点是可以减小模型的偏差,提高模型的准确性。 3. Stacking:这是一种基于模型组合的集成学习方法,即将多个不同的基学习器的预测结果作为样本特征,再通过一个元学习器来进行最终的预测。Stacking方法的优点是可以将不同的基学习器的优点进行组合,提高模型的性能。 总之,BaggingBoostingStacking是集成学习中常用的三种方法,它们都可以通过组合多个基学习器来提高整体的学习性能,具有广泛的应用价值。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值