当我们运用训练好了的模型来预测未知数据的时候发现有较大的误差,我们下一步可以做什么?
1.获得更多的训练实例——通常是有效的,但代价较大,下面的方法也可能有效,可考虑先采用下面的几种方法。
2.尝试减少特征的数量
3.尝试获得更多的特征
4.尝试增加多项式特征
5.尝试减少归一化程度λ
6.尝试增加归一化程度λ
我们不应该随机选择上面的某种方法来改进我们的算法,而是运用一些机器学习诊断法来帮助我们知道上面哪些方法对我们的算法是有效的。通常会从以下几个角度入手,差不一定是数据集越大效果越好。
一. 算法的性能评估:
a. 评估假设函数是否过按拟合?