问题
在上一个问题 “boosting思想” 中我们已经简单谈了下提升方法 boosting 的基本思路,这个问题让我们深入了解下 boosting 思想中最具代表性的算法 AdaBoost。GBDT和XGBoost《统计学习方法》与《机器学习》这两本书中都没有涉及,但是看别人在牛客网上的面经分享都有提到,其实这两个算法主要在竞赛中经常被用到,因此还是有必要了解一下。
AdaBoost算法
特点:
- 不改变所给的训练数据,而不断改变训练数据权值的分布,使得训练数据在基本分类器的学习中起不同的作用
- 利用基本分类器的线性组合构建最终的分类器
假设给定一个二类分类的训练数据集:
T = { ( x