机器学习之Adaboost（机器学习技法）

最新推荐文章于 2024-05-05 19:16:43 发布

Elong_Hu

最新推荐文章于 2024-05-05 19:16:43 发布

阅读量2.6k

点赞数 1

分类专栏：机器学习 Machine Learning 数据科学家之路文章标签： AdaBoosting 机器学习机器学习技法集成学习林轩田

本文链接：https://blog.csdn.net/qq_34993631/article/details/79519738

版权

数据科学家之路同时被 3 个专栏收录

50 篇文章 6 订阅

订阅专栏

机器学习

38 篇文章 5 订阅

订阅专栏

Machine Learning

35 篇文章 4 订阅

订阅专栏

逐步增强法（AdaptiveBoosting）引例

逐步增强法的主要思想就是拿着一堆很弱的模型可以合成一个非常强大的模型（这一点与Bagging十分相似）。

一个案例对算法的直观描述

在课堂上老师让小孩去辨识图中那些是苹果，由于小孩的思维比较简便所以他们一次只能够学到一条规则：

一号同学说苹果是圆的所以他在一些图片的辨识上回犯错如下，所有的错误都放大显示所有的正确的都相对缩小：

这时我们的做法就是将一号同学犯错的部分放大以便引起下一个同学的注意。而下一个同学会在上一个学生的基础上提出一条新的规则（也就是在图中将苹果误判的图片中找规律）。假设下一个学生说苹果是红色的这条规则，这时判断苹果的规律就成了圆的红色的他犯的错误如下：

就按照这样的“放大错误缩小正确”的方式来让机器去专注于犯错的资料判断上调整下一次学习的注意事项最后达到错误率的最小化。

下图就是使用逐步增强法来将一些简单的模型组合起来的结果，表现的非常不错。

逐步增强法的一些准备

从Bagging开始

Bagging的核心在于BootStrapping，它有时会得到相同的资料如下图所示：

在错误衡量方面假如说一笔资料犯了错误我们就要乘上它对应的权重。比如在上图中X1犯错我们就要在它的单笔错误上乘2，而在X3犯错误时就要乘以0,因为就没有X3这笔资料。这就是我们给予不同重要的错误在计算上采用的策略，几倍重要就给予几倍的权重。也就是图中的u控制了这个权重，这些错误权重的大小就会影响到我们学习的侧重点进而得到不同的模型g。

得到不同的模型g

得到不同的模型g是我们能够通过融合过程得到好的模型的关键（各取所长）所以我们需要不同的g。现在我们试着得到两个非常不同的g如下图所示：

我们的gt是在ut为权重的情况下得到的，g(t+1)是在u(t+1)为错误权重的情况下得到的。他们所在乎的错误不同，比如有的在乎颜色上面的错误有的在乎形状上面的错误。如果g在u(t+1)为错误权重的情况下得到结果很差那么就说明演算法在两堆资料所在乎的错误非常不同所以在第二次学习时我们就不会学到与gt相似的模型了，进而学到的两个模型gt与g(t+1)非常不同。通过这样的策略我们得到了不同的模型g。

通过上面的解释我们就知道要想得到一个不同于当前的模型一个方法就是让我们这个模型在新的权重的资料上表现不好。表现不好就是这个模型在新的实例上的判断就像乱猜一样，而用乱猜的方式去做是非题从长远来看它的准确率就是1/2。在这个问题中数学化的表达就是犯错误的权重/总权重 = 1/2如下图所示:

为了让当前的模型在新的权重的资料上表现为乱猜那么就要满足上图的条件，进一步推导为正确的权重 = 错误的权重，如下图：

现在我们的目标就成了，拿着当前的模型在下次训练时资料的错误权重能够与正确的权重相同，这样也就达到了本次的模型在下次的资料上表现为乱猜的效果。所以我们采用的方式就是当前的做错的乘上作对权重的比例做对的乘上做错权重的比例如下图所示：

Adaboost算法

更有意义的放缩因子

现在我们不在使用上面的规则去更新新一轮资料的权重而是使用下图中的规则：

其中ε就是我们当前轮资料中错误权重的比例，我们的新的因子就是方块t（◆t）。在更新的时候我们会在犯错误权重的资料上乘上◆t，在正确的权重上除以◆t，这样就达到了让我们新的算法更注重于上一个算法犯错误的地方。具体来说，如果ε的值<=1/2那么也就是说现在模型的表现要比乱猜来的好。在这个情况下◆t会大于1这样就会使得错误被放大正确被缩小。