https://www.cnblogs.com/maybe2030/p/4585705.html
随机森林就是通过集成学习的思想将多棵树集成的一种算法,它的基本单元是决策树。
将若干个弱分类器的分类结果进行投票选择,从而组成一个强分类器,这就是随机森林bagging的思想。
“随机”是指以下两个随机性
(1)随机且有放回地从训练集(N个样本)中的抽取n个训练样本。
(2)如果每个样本的特征维度为M,指定一个常数m<<M,随机地从M个特征中选取m个特征子集,每次树进行分裂时,从这m个特征中选择最优的。