机器学习所关注的一个根本问题是如何提高学习系统的泛化能力,而集成学习可以显著提高学习系统的泛化能力,因此它曾被权威学者Dietterich列为机器学习4大研究方向之首。周志华教授的研究组在集成学习领域进行了深入研究并取得了具有国际影响的成果:
由于利用 多个学习器可以取得比单一学习器更好的性能,因此很多学者 试图通过增加学习器的数目来提高泛化能力。周志华等人提出了 选择性集成理论证明 了从一组学习器中选择部分学习器可以比用所有学习器构建集成学习系统更优越并设计出了有效的选择性集成算法。 理想的学习方法不仅要有强的泛化能力,还要有好的可理解性。周志华等人提出了二次学习的思想,将集成学习用作预处理,设计出了泛化能力强、可理解性好的新型规则学习方法 C4.5 Rule-PANE. Dietterich在1997年提出多示例学习这一新型机器学习框架时,同时提出了一个公开问题,即如何为常用的机器学习算法设计其多示例版本。目前很多常用算法都有了多示例版本,但其转化过程均是针对具体算法进行的,缺乏一般性的准则。周志华等人提出了监督学习算法向多示例学习算法转化的一般准则,还提出了基于集成学习的多示例问题求解方法并在基准测试上取得了国际上最好的结果。