使用集成学习的工作流程(核心版)
- 加载数据
- 数据处理
- 使用交叉验证和网格搜索确定集成模型的最优超参数
- 建立并训练模型
调库
- 从sklearn库中调ensembel包下的集成算法
- 在算法思想理解以后,调库实现较为简单,重要的是超参数的调节,一般可以选择交叉验证法
- 基于Bagging思想的算法模型
- 基于boosting思想的算法模型
主要算法
基于Bagging思想
# 调用随机森林分类算法模型
from sklearn.ensemble import RandomForestClassifier
# 调用随机森林回归算法模型
from sklearn.ensemble import RandomForestRegressor
# 调用Bagging分类算法模型
from sklearn.ensemble import BaggingClassifier
# 调用Bagging回归算法模型
from sklearn.ensemble import BaggingRegressor
基于boosting思想
# 调用Adaboost分类算法模型
from sklearn.ensemble import AdaboostClassifier
# 调用Adaboost回归算法模型
from sklearn.ensemble import AdaboostRegressor