1.看测试数据结果前,先看训练数据有没有做好。没有做好的原因:
1.1模型的灵活性不够
a.可以增加更多特征,
b.可以设一个更大的模型,
c.可以用深度学习
1.2优化做得不好(梯度下降问题)
1.3如何判定是以上哪个原因
1.3.1可以先跑一些比较小的、比较浅的网络,或甚至用一些非深度学习的方法,比如线性模型、支持向量机(Support Vector Machine,SVM),SVM 可能是比较容易做优化的,它们比较不会有优化失败的问题.看得到的损失。
1.3.2只有同样的模型,越做深损失越大,说明优化有问题。
1.3.3训练数据上面的损失小,测试数据上的损失大,可能是真的过拟合
1.4过拟合