深度学习模型无法在云服务器跑通的问题

最近开始做毕设了,发现我遇到的问题在CSDN上的回答很少,所以来记录一下自己解决问题的过程。

写在前面

我做毕设用的是这位博主的代码,他的代码注释写的非常清楚,在b站上也有很详细的教程,非常适合小白上手实战(尤其是大四要做深度学习毕设但是之前完全没有接触过深度学习的同学)。我用他的代码来训练自己的数据集,之前能够在自己电脑上跑通,但是因为后续需要跑更加复杂的网络,自己的电脑完全跑不动,所以选择用服务器来跑,我用的是AutoDL,如果有同学和我一样,用的是Bubbliiiing大佬的代码就可以接着往下看。

报错

将代码和数据上传到服务器后运行train.py。
运行train.py

出现如下报错。
报错信息
从报错信息来看,是数据加载出了问题,DataLoader出了问题。我参考了这篇博文文中提到了绝对路径的问题,在Bubbliiiing大佬的代码中需要先运行voc_annotation.py文件,对原始数据集进行划分,运行以后会生成一系列txt文件,来指明哪些图片作为训练集,哪些图片作为验证集,在这些txt文件中会将图片文件的路径标明。
去对应的txt文件查看,发现果然存在绝对路径。
生成的txt文件内容
我是第一次使用云服务器,没有注意到这个问题,在云服务器用来读取数据集的txt文件是我之前在自己电脑上跑时生成的,直接移植到云服务器上肯定会报错。

解决方案

将之前生成的一系列txt文件删除,在我的模型中,需要删除如下txt文件
在这里插入图片描述
需要删除的txt文件
将对应的txt文件删除后,在云服务器重新运行voc_annotation.py文件。
在这里插入图片描述
在云服务器重新生成txt文件。
在云服务器生成的txt文件
重新运行train.py文件,正常运行!
报错解决

您好!对于云服务器部署深度学习模型,您可以按照以下步骤进行操作: 1. 选择云服务提供商:首先,您需要选择一个云服务提供商,如阿里云、腾讯云或亚马逊AWS等。不同的云服务提供商可能会有不同的服务和定价方案,您可以根据自己的需求选择最适合的。 2. 创建虚拟机实例:在所选的云服务提供商中,您需要创建一个虚拟机实例作为您的云服务器。在创建实例时,您需要选择适当的配置,包括计算资源、存储容量和操作系统等。 3. 安装深度学习框架:在您的云服务器上安装所需的深度学习框架,如TensorFlow、PyTorch或Keras等。您可以通过命令行或者包管理器来安装这些框架。 4. 数据和模型上传:将您的深度学习模型和训练数据上传到云服务器。您可以使用SCP或者SFTP等工具进行文件传输。 5. 配置环境和依赖项:根据您的深度学习模型的需求,安装所需的依赖项和库。这些依赖项可能包括GPU驱动、CUDA和cuDNN等。 6. 运行深度学习模型:在您的云服务器上运行深度学习模型。您可以使用命令行或者编写脚本来执行训练或推理任务。 7. 监控和优化:监控您的云服务器的性能和资源利用情况。根据需要,您可以进行调优和优化,以提高模型的训练速度或推理性能。 请注意,具体的步骤可能因云服务提供商和深度学习框架的不同而有所差异。此外,还需要确保您有足够的计算资源和存储空间来支持您的深度学习任务。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值