一、随机森林算法简介:
在机器学习中,随机森林是一个包含多个决策树的分类器, 并且其输出的类别是由个别树输出的类别的众数而定。 Leo Breiman和Adele Cutler发展出推论出随机森林的算法。而 "Random Forests" 是他们的商标。 这个术语是1995年由贝尔实验室的Tin Kam Ho所提出的随机决策森林(random decision forests)而来的。这个方法则是结合Breimans 的 "Bootstrap aggregating" 想法和 Ho 的"randomsubspace method"以建造决策树的集合。
根据下列算法而建造每棵树 :
1. 用M来表示训练用例(样本)的个数,N表示特征数目。
2. 输入特征数目n,用于确定决策树上一个节点的决策结果;其中n应远小于N。
3. 从M个训练用例(样本)中以有放回抽样的方式,取样k次,