1,模型:
1),线性回归模型
https://zhuanlan.zhihu.com/p/49480391
2),决策树模型
https://zhuanlan.zhihu.com/p/65304798
3),GBDT模型
https://zhuanlan.zhihu.com/p/45145899
4),XGBoost模型
https://zhuanlan.zhihu.com/p/45145899
5),LightGBM模型
https://zhuanlan.zhihu.com/p/89360721
2,模型性能验证
1)损失函数,代价函数,目标函数
损失函数:计算的是一个样本的误差
代价函数:是整个训练集上所有样本误差的平均
目标函数:代价函数 + 正则化项
https://blog.csdn.net/qq_28448117/article/details/79199835
2)验证方法:
交叉验证法
留一验证法:针对时间序列问题的验证
3,模型调参
1,贪心算法
在对问题求解时,总是做出在当前看来是最好的选择。也就是说,不从整体最优上加以考虑,它所做出的仅仅是在某种意义上的局部最优解。
贪心算法的基本思路:
a,建立数学模型来描述问题
b,把求解的问题分成若干个子问题
c,对每个子问题求解,得到子问题的局部最优解
d,把子问题的解局部最优解合成原来问题的一个解