随机森林是属于集成学习中bagging方法下的一种算法。不扯那么多,随机森林”随机”在两个方面:
1)如果训练集大小为N,对于每棵树而言,随机且有放回地从训练集中的抽取N个训练样本(称为bootstrap sample方法,中文好像翻译作自举),作为该树的训练集;
2)如果每个样本的特征维度为M,指定一个常数m<< M,随机地从M个特征中选取m个特征子集,每次树进行分裂时,从这m个特征中选择最优的。
最后,没有剪枝过程。
机器学习--决策树之随机森林
最新推荐文章于 2019-07-01 10:31:31 发布