机器学习实战之AdaBoost元算法

最新推荐文章于 2022-04-10 19:06:16 发布

煊琰

最新推荐文章于 2022-04-10 19:06:16 发布

阅读量162

点赞数

今天学习的机器学习算法不是一个单独的算法，我们称之为元算法或集成算法（Ensemble）。其实就是对其他算法进行组合的一种方式。俗话说的好：“三个臭皮匠，赛过诸葛亮”。集成算法有多种形式：对同一数据集，使用多个算法，通过投票或者平均等方法获得最后的预测模型；同一算法在不同设置下的集成；同一算法在多个不同实例下的集成。本文着重讲解最后一种集成算法。

bagging

如果训练集有n个样本，我们随机抽取S次，每次有放回的获取m个样本，用某个单独的算法对S个数据集（每个数据集有m个样本）进行训练，这样就可以获得S个分类器。最后通过投票箱来获取最后的结果（少数服从多数的原则）。这就是bagging方法的核心思想，如图所示。