Blending and Bagging

最新推荐文章于 2022-04-23 16:48:00 发布

v_HELEN_v

最新推荐文章于 2022-04-23 16:48:00 发布

阅读量733

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Christ_123/article/details/68070590

版权

这次我们要讲的主要是Blending 和Bagging。

我们可不同的方式来得到不同的g。如果我们综合一下这些g，那么我们很可能会得到一个更好的g。

Blending:

形象地说,就是类似于投票,每个g有着一些票，看大家投票的结果决定最后的g。

Uniform Blending:

每个g都只有1票。

Classification:

Binary Classification：

少数服从多数，感觉挺直白的。

Multiclass Classification：

Regression：

也就是g的平均值，可能会比单一的g要好。

下面是证明平均的g，会比单一的g好：

也就是说平均得到的g会比较好。

一个算法的好坏，通常是由方差和偏差决定的。我们利用取平均的办法获得g，减少了方差，获得了比较好的稳定性。

Linear Blending:

每个人可以有不同票数。

把当成变量，目标函数是，约束条件是。

我们发现，其实目标函数特别像我们之前学过的Linear Regression+Transform的目标函数。

只不过多了一个的条件。

对于这个条件，我们可以暂时忽视它去求解。

如果求出来的小于0，也就是这个gt是错的。

所以实际工作里，我们不用constraints，如下图。

Linear Blending versus Selection

让我们回忆一下Selection：

几个模型跑，选取E_in最小的那个。也就是每个模型里，选取最好的g，再在最好的g中间选取一个最好的，也就是选到了best of best，那么我们会付出比较高的复杂度代价,所以一般我们会用validation。
Linear blending可以通过设置a来选到 best of best。
由于linear blending的结果是包含best of best的，所以linear blending付出的复杂度代价更大。
我们要最小化E_val而不是E_in。

Any Blending:

也就是算的时候用Non-Linear, 其他的跟Linear Blending一致。

Any Blending非常powerful, 我们需要小心overfit.

总结：

我们可以从不同的model、不同的model parameter、不同的算法随机性（比如PLA）、数据的随机性来得到不同的g。

Blending就是在我们得到不同的g之后，综合不同的g来获得表现更好的g。

Blending在实际上很有用，只不过我们要付出模型复杂度上的代价，还有计算复杂度。

Bagging

维基百科上的解释挺好的了，主要就是一个Bootstrap。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。