集成学习:
常见的集成学习思想有:
• Bagging (并联)
代表:随机森林
• Boosting(串联)
代表:Adaboost —— 根据正确率修改样本权重
GBDT —— 根据残差(梯度)修改样本标签值
• Stacking
Bagging 并联训练:-------------------------------------------------------------------------------------
预测:
随机森林:
• 在Bagging策略的基础上进行修改后的一种算法
• 1. 从原始样本集(n个样本)中有放回重采样选出n个样本并去重,也就是训练的样本数目实际上应该是小于n。
• 2. 从所有属性中随机选择K个属性,(不放回采样)从K个属性中选择出最佳分割属性作为节点来迭代的创建决