1.线性回归模型
线性回归对于特征的要求;
处理长尾分布
理解线性回归模型
2.模型性能验证
评价函数与目标函数
交叉验证方法
留一验证方法
针对时间序列问题的验证
绘制学习曲线
绘制验证曲线
3.嵌入式特征选择
Lasso回归
Ridge回归
决策树
4.模型对比
常用线性模型
常用非线性模型
5.模型调参
贪心调参方法
网格调参方法
贝叶斯调参方法
小结
线性回归模型的数据集要尽量调整成正态分布;
用时间靠前的4/5样本当作训练集,时间靠后的1/5当作验证集,结果和五折交叉验证差距不大;
线性回归,Ridge和Lasso模型对比,前两个较好,但Ridge的coef参数很多较大,抗扰动弱;
常用模型中,随机森林模型表现最好,LGBM二好;