问题描述
使用pytorch对网络模型进行训练的时候,莫名其妙出现了数据NAN的问题,在反复确认读入数据没有问题(已经归一化),且网络模型加载权重也没问题的情况下,发现这种前向传播出现NAN属于薛定谔现象…即有时候会发生,有时候不发生,甚至使用相同的代码连续对同一个操作进行两次计算后结果第一次是NAN,第二次就正常。。
解决方法
灵感来源:https://discuss.pytorch.org/t/well-formed-input-into-a-simple-linear-layer-output-nan/74720/7
解决方法就是更新numpy!!!
pip install --upgrade numpy
直接更新到最新版本,问题莫名解决了。。