- Bagging
- Boosting
- Stacking
- 代码演示
集成算法目的:简单来说就是构建并结合多个学习分类器来完成学习任务,也称为多分类器系统。
例如:有分类任务,使用A分类器和B分类器分别做分类,再结合结果输出。当然有多种模式。
1.Bagging
训练多个分类器取平均值
f ( x ) = 1 M ∑ m = 1 M f ( x ) f(x) = \frac{1}{M} \sum_{m=1}^M f(x) f(x)=M1m=1∑Mf(x)
也就是并行进行一堆分类器,最后求平均
代表的算法就是随机森林,各个tree之间不影响。
随机:数据随机采样(数据有放回的随机采样,特征采集随机采集)