更多文章参考:自己动手实现darknet预测分类动态库
%g和%f区别:
它们都是浮点输入/输出的例子:
%g和%G是科学记数法浮点数%e和%E的简化。
%g将采用可表示为%f(简单浮点数或双精度)或%e(科学记数法)的数字,并将其作为两者中较短的一个返回。
您的打印语句的输出将取决于总和的值。
准确率输出%g,集成到公司软件时,采用GPU模式时,异常输出nan。
因为准确率的值为0-1之间,因此发生NaN的唯一方法是处理不正确的0/0,代码中出现了0/0。
When training on GPU, the error "Model diverged with loss = NaN" is often caused by a sotmax that's getting a symbol larger than vocab_size
参考文献: