算法 随机森林算法: 决策树生长 / 投票过程 生长过程: 容量N bootstrap取样,随机抽取自助样本集,重复K次形成一个新的训练集 2.一个自助样本集,就是一棵分类树 。M个输入特征,选择一个作为节点分支生长。 3.为了低偏差/高差异,而要充分生长,需剪枝。 投票过程:bagging ,多个决策树分类器,获得预测函数序列汇总评估。 有点:输入变量海量 分类器精准 决策类别时,评估变量的重要性。 缺点: 噪音大的分类回归问题,会过拟合