集成学习即essemble技术,将单个学习器通过一定规则联合,提高学习器的整体表现。
当所有单个学习器都是同一类型时,即是同质的,每个学习器成为基学习器;当单个学习器不同时,则称为异质的,不存在基学习器的说法。
当学习器之间强关联,存在一定的依赖关系,表现为串行,这类算法的代表为Boosting,其中AdaBoost是这类学习器的代表。
学习器之间不存在依赖关系,表现为并行,Bagging和Random Forest是两类典型代表。AdaBoost主要用于二分类,需要通过一定的修改才能用于多分类,而Bagging和Random Forest则可随意用于多分类,回归等。