最近在写新的网络模型的时候,遇到了内存溢出的情况。
这种情况很可能是:
(1)Loss出现了INF或者NAN的情况,需要查询Loss的代码,检查是否计算存在问题。
(2)查询资料,发现,这种情况很有可能是在计算交叉熵,出现溢出的情况,比如真实的类别有三个0,1,2,计算的时候出现了-1或其它标签数据,就有可能造成这种情况。
总的来说,很可能是Loss计算的问题,写的时候需要具体检查。
最近在写新的网络模型的时候,遇到了内存溢出的情况。
这种情况很可能是:
(1)Loss出现了INF或者NAN的情况,需要查询Loss的代码,检查是否计算存在问题。
(2)查询资料,发现,这种情况很有可能是在计算交叉熵,出现溢出的情况,比如真实的类别有三个0,1,2,计算的时候出现了-1或其它标签数据,就有可能造成这种情况。
总的来说,很可能是Loss计算的问题,写的时候需要具体检查。