在机器学习中,随机森林是一个包含多个决策树的分类器, 并且其输出的类别是由个别树输出的类别的众数而定。
Leo Breiman和Adele Cutler发展出推论出随机森林的算法。 而 “Random Forests” 是他们的商标。 这个术语是1995年由贝尔实验室的Tin Kam Ho所提出的随机决策森林(random decision forests)而来的。这个方法则是结合 Breimans 的 “Bootstrap aggregating” 想法和 Ho 的”random subspace method”” 以建造决策树的集合。
决策树
决策树是这样的一棵树:
- 每个内部节点上选用一个属性进行分割
- 每个分叉对应一个属性值
- 每个叶子节点代表一个分类
详见决策树讲解
学习算法
根据下列算法而建造每棵树:
1. 用 N 来表示训练例子的个数,
2. 我们会被告知一个数 m