- 检查代码有无问题,这是一个很重要原因。比如该是5的地方写成了6,或者变量导入错误等等。
- 检查所有的权重有无经过正则化,比如有些权重值是7.5,-8.6等等这肯定引起loss变大。
- 使用drop,batchnormal等等正则化数据。
损失爆炸梯度爆炸解决办法
于 2021-03-25 10:31:38 首次发布
3379
583
2530

被折叠的 条评论
为什么被折叠?
>
