集成学习案例——蒸汽量预测
数据处理
1.删除训练集数据分布和测试集数据分布不均的特征
2.查看特征相关性,将相关性小的特征删除
3.数据归一化
特征工程
1.Box-Cox变换
box-cox变换的目标有两个:一个是变换后,可以一定程度上减小不可观测的误差和预测变量的相关性。主要操作是对因变量转换,使得变换后的因变量于回归自变量具有线性相依关系,误差也服从正态分布,误差各分量是等方差且相互独立。第二个是用这个变换来使得因变量获得一些性质,比如在时间序列分析中的平稳性,或者使得因变量分布为正态分布。
2.对数变换target目标值
提升特征数据
模型构建
损失函数:均方误差MSE
删除离群值
训练模型
交叉验证
网格搜索最佳参数
预测模型结果
输出到“predict.txt”