集成框架:集成多种算法
一、Bagging:民主决议。
-
如随机森林:对同一输入,取众数作为输出。
-
优点:通用性好;自动划分测试集;不容易出现过拟合;超参数少一般只有树的数量……
-
缺点:树太多时,空间复杂度高……
二、Boosting:不断补充:专门处理前一个分类器效果差的样本。
-
优点:对于基分类器要求低;分类器个数不会太多……
-
缺点:过拟合现象严重……
AdaBoost
- 优点:误差必然由上界;几乎不需要调参
- 缺点:容易陷入局部最优解
如随机森林:对同一输入,取众数作为输出。
优点:通用性好;自动划分测试集;不容易出现过拟合;超参数少一般只有树的数量……
缺点:树太多时,空间复杂度高……
优点:对于基分类器要求低;分类器个数不会太多……
缺点:过拟合现象严重……