因为是以李航的《统计学习方法》为主来看,将西瓜书作为补充。李航书的特点就是10个算法,每个推导,实例辅助,不拖泥带水,干货满满。西瓜书恰好弥补了李航书的不足,非常丰润,很多补充的小知识点。这篇是在整理李航书的boosting时补充其内容的。
1. 个体与集成
集成学习(ensemble learning)通过构建多个个体学习器并结合起来完成学习任务。
要获得好的集成,个体学习器应该“好而不同”,要有一定的“准确性”,即学习器不能太坏,并且要有多样性,之间具有差异。互为补充,才可提升效果。
集成学习研究核心:如何产生并结合个体学习器。
根据个体学习器的生成方式,集成学习大致分为两类:
{
个体学习器间有强依赖,必须串行生成的序列化方法