*********************随机森林概述***************************
在我们学习随机森林前,要对决策树有一定了解,尤其对其中决策树生成算法要做理解,详见博客。
森林顾名思义,由很多棵树组成,这一颗颗树就是我们需要构造的决策树,由这些树组成的森林就是随机森林,
当我们输入一个要预测分类的数据时,每个决策树都会接收数据并产生一个分类结果,然后采用‘投票机制’,认为哪个结果出现次数最多就归为哪一类。
*********************随机森林构造过程**********************
随机森林构造过程分为四步:随机样本的选取,随机选择特征,构建决策树,随机森林投票分类
1.随机样本的选取
我们采用bootstrap自助法进行样本选择,假设有训练数据有N个,我们有放回的采取