训练深度网络模型,刚开始约10epoch的loss下降幅度很大,在大约10个epoch之后,变得非常缓慢。请问是什么问题呢?
train loss随训练时间的变化图
val的loss随训练时间的变化图
之前以为是训练集过小导致的,加入了新的训练集以后,这种情况反而更严重了,第一初始化loss减少很多,第二在大约6个epoch以后loss下降就非常缓慢了,并且由于验证集没有变化,所以val loss的变化也很奇怪,一直无法收敛。附图如下(添加训练集,未动验证集):
仅添加训练集后train loss的变化情况
仅添加训练集val loss的变化情况
请问有可能是因为什么原因呢?有没有好的解决办法?感谢!