服务器训练好的模型本地运行错误

最新推荐文章于 2024-04-21 10:27:28 发布

Longer2048

最新推荐文章于 2024-04-21 10:27:28 发布

阅读量720

点赞数

分类专栏：深度学习文章标签： tensorflow 深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/BeiErGeLaiDe/article/details/106061713

版权

深度学习专栏收录该内容

7 篇文章 5 订阅

订阅专栏

现象：最近用google colab训练模型。分布在mnist和自定义的数据集上面训练好了两个CapsuleNet。colab 测试通过，一切正常。权重下载下来本地测试时发现：mnist的模型一切正常，但是自定义数据集上面的CapsuleNet在本地再次训练时直接爆炸了，其每个类别的推理结果都是乱码。

网上解决方案：99%都是自己代码的问题，自己debug去（输入网络的数据对不对，本地代码的设置对不对，代码是不是与服务器中的一致等）。

现象解释：经过脱发测试，发现是本地环境问题。

测试验证：本地使用CPU推理一切正常，acc>0.9。而使用GPU推理时，acc<0.1，且输出结果是乱的。

解决方法：

将tensorflow、cuda、cudnn的版本全部更换（我的：tensorflow1.15.2 --> tensorflow1.12.0, CUDA v10.0 --> CUDA v9.0, cudnn v7.6.5 --> cudnn v7.4.1）

后记：

1.试过将python和tensorflow进行版本更新、回退或重装，都不行，问题依旧。

2.我试过tf和cuda不动，直接覆盖重装同版本的cudnn，但是不行，还是全部换版本重装吧。

3.查看python运行log，看看cuda和cudnn有没有warning或error，有的话根据提示进行操作。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
服务器训练好的模型本地运行错误

现象：最近用google colab训练模型。分布在mnist和自定义的数据集上面训练好了两个CapsuleNet。colab 测试通过，一切正常。权重下载下来本地测试时发现：mnist的模型一切正常，但是自定义数据集上面的CapsuleNet在本地再次训练时直接爆炸了，其每个类别的推理结果都是乱码。网上解决方案：99%都是自己代码的问题，自己debug去（输入网络的数据对不对，本地代码的设置对不对，代码是不是与服务器中的一致等）。现象解释：经过脱发测试，发现是本地环境问题。测试验证：本地使用C
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。