增加样本 增加样本和预处理应该是最靠谱的方法 dropout 在容易过拟合的层前加drop,比如全连接层,还有lstm层,lstm层基本就是4倍的kernel×input_dim 的一个全连接层 正则化 慢慢调了,正则化的幅度最好不要掩盖原有loss分类的幅度 l1正则化会使参数变得稀疏,具有更强的维度选择性 l2正则化会使模型的参数整体不至于太大。 early stop 治标不治本…你要想停随时可以停