CRNN训练本地loss有值，但服务器GPU训练loss为Nan

最新推荐文章于 2023-06-05 15:34:00 发布

何小义的AI进阶路

最新推荐文章于 2023-06-05 15:34:00 发布

阅读量932

点赞数 2

分类专栏：人工智能深度学习文章标签： ocr

原文链接：https://blog.csdn.net/seven08290/article/details/103823364

版权

人工智能同时被 2 个专栏收录

20 篇文章 0 订阅

订阅专栏

深度学习

13 篇文章 1 订阅

订阅专栏

转载来自：

https://blog.csdn.net/seven08290/article/details/103823364

---------------------------------------------------------------------------------------------------------

近期本人在做OCR的时候，代码本地训练loss每一次迭代都有值。

但是到服务器，每一次迭代loss都为Nan。

后来发现，服务器是有GPU 有cuda，代码要略加修改：

---- 在计算CTC loss前，将length和text加上cuda即可。问题解决！！！如下：

        preds = crnn(image)
        batch_size = image.size(0)
        text, length = converter.encode(label)

        if str(device) == 'cpu':
            # print('cpu!!!!!!!!!!!!!!!!!!!!!')
            pass
        else:
            print('gpu!!!!!!!!!!!!!!!!!!!!!')
            # 服务器 GPU训练加上cuda 否则loss一直为NaN
            text = text.to(torch.long).cuda()
            length = length.to(torch.long).cuda()

        preds_size = Variable(torch.IntTensor([preds.size(0)] * batch_size))
        cost = criterion(preds, text, preds_size, length) / batch_size

何小义的AI进阶路

关注

2
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
CRNN训练本地loss有值，但服务器GPU训练loss为Nan

转载来自：https://blog.csdn.net/seven08290/article/details/103823364---------------------------------------------------------------------------------------------------------近期本人在做OCR的时候，代码本地训练loss每一次迭代都有值。但是到服务器，每一次迭代loss都为Nan。后来发现，服务器是有GPU 有cuda，代码要.
复制链接

扫一扫