一、当模型预测未知数据效果误差巨大时,解决方法?
当我们用已经训练好的模型来预测未知数据发现巨大误差时,下一步要做的改进模型的方法通常有六种:
1.获得更多的训练样本----解决高方差
2.尝试减少特征的数量----解决高方差
3.尝试获得更多的特征----解决高偏差
4.尝试增加多项式特征----解决高偏差
5.尝试减少归一化程度λ----解决高偏差
6.尝试增加归一化程度λ----解决高方差
因此,当模型预测发现巨大误差,我们首先要判断误差原因是高偏差还是高方差即模型欠拟合还是过拟合,下面是涉及到的相关知识的学习记录。
二、高偏差和高方差(欠拟合和过拟合)问题
1、偏差-方差窘境
对算法的泛化误差进行拆解:
学习算法的泛化误差为: