文章目录
前言
之前我们介绍了决策树(DT),为了提高性能,研究人员把多个决策树组合起来,演变出随机森林的(RF),这其实就是一种集成学习的思路。
当然啦,集成学习肯定不止随机森林,只不过随机森林的性能实在是不错,且简单粗暴,在各领域内运用广泛,所以单独开一步来介绍。其余的集成学习算法,就在这一步一起打包献上。
首先我们来看集成学习的技术路线:
很简单啊,首先是生成多个单一的学习器,然后把所有的学习器汇总,通过某种策略组成强学习器。把这句话看2遍,然后我们来思考一下细节:
首先,如何构建多个单一的学习器?想想随机森林是怎么干的。
其次,如何把多个单一的学习器汇总在一起,需要一种怎么样的策略?同样,想想随机森林是怎么干的。
假设我们思考了5分钟,豁然开朗:
(1)问:如何构建多个单一的学习器?(简答题,