1 训练时出现NaN 使用混合精度训练时出现了NaN网络输入:无问题;网络输出:Nan问题分析:出现了极大的梯度,导致网络权重NaN 这通常由Sigmoid等函数导致 解决方法 找到导致无穷的loss或者layer将其替换为不容易出现问题的loss / layer 更多信息:https://zhuanlan.zhihu.com/p/443166496 未完待续