神经网络再训练过程中,loss不下降,稳定再ln(类别数),如二分类问题稳定在0.69,十分类问题稳定在2.30,出现这种情况:
①检查卷积层中间层输出,可能出现了weight NaN,导致卷积输出NaN,此时网络预测结果全部相同,所有目标被判为同一类;
②检查网络最后一层是否添加了relu或softmax等激活函数
③调整参数,如降低学习率,修改optimizer,如从SGD换为Adam
④调整网络权重初始化方式
⑤在网络中添加BN层
神经网络再训练过程中,loss不下降,稳定再ln(类别数),如二分类问题稳定在0.69,十分类问题稳定在2.30,出现这种情况:
①检查卷积层中间层输出,可能出现了weight NaN,导致卷积输出NaN,此时网络预测结果全部相同,所有目标被判为同一类;
②检查网络最后一层是否添加了relu或softmax等激活函数
③调整参数,如降低学习率,修改optimizer,如从SGD换为Adam
④调整网络权重初始化方式
⑤在网络中添加BN层