总述:
本意在于记录一下这个问题产生的种种情况,请注意不是显卡坏了,而是代码出错了。
1. nan问题
在训练的时候,长久累积某一个tensor,导致他的值过大产生nan。
还有可能是,某一个参数没有初始化,使得内存地址随意赋值,常出现于nn.paramter()的时候
总述:
本意在于记录一下这个问题产生的种种情况,请注意不是显卡坏了,而是代码出错了。
1. nan问题
在训练的时候,长久累积某一个tensor,导致他的值过大产生nan。
还有可能是,某一个参数没有初始化,使得内存地址随意赋值,常出现于nn.paramter()的时候