机器学习实战-54: 集成学习分类算法(ada-boost)

本文链接：https://blog.csdn.net/shareviews/article/details/82929349

集成学习分类算法

深度学习原理与实践(开源图书)-总目录，建议收藏，告别碎片阅读！

集成学习分类算法(ada-boost)属于监督学习算法。常用分类算法包括：逻辑回归(Logistic Regression, LR)、K最近邻(k-Nearest Neighbor, KNN)、朴素贝叶斯模型(Naive Bayesian Model, NBM)、隐马尔科夫模型(Hidden Markov Model)、支持向量机(Support Vector Machine)、决策树(Decision Tree)、神经网络(Neural Network)和集成学习(ada-boost)。

在实际部署场合，由于数据的多样性和复杂性，前期评估的分类模型往往不是最佳的。对此通过多种分类方法的融合即集成学习有利于可以这个缺陷，增强了分类算法的鲁棒性。集成学习(ada-boost)是一种机器学习范式，它试图通过连续调用单个的学习算法，获得不同的基学习器，然后根据规则组合这些学习器来解决同一个问题，可以显著的提高学习系统的泛化能力。

1 算法原理

集成学习(ada-boost)分类算法是通过组合多个基分类器(base classifier)来完成学习任务。基分类器一般采用的是弱可学习(weakly learnable)分类器，通过集成学习，组合成一个强可学习(strongly learnable)分类器。所谓弱可学习，是指学习的正确率仅略优于随机猜测的多项式学习算法；强可学习指正确率较高的多项式学习算法。集成学习的泛化能力优于单一的基分类器，融合后的分类结果准确率更高。

集成学习(ada-boost)分类算法采用加法模型，使用若干个弱分类器以加权平均的形式构成强分类器。集成学习利用前向分步学习策略，利用前一个弱学习器的结果来更新后一个弱学习器的训练集权重。集成学习的损失函数一般采用指数函数。

集成学习(ada-boost)分类算法的核心步骤如下: