在linux下用终端训练和测试模型

目录

步骤

(1)在python中,指定要使用的gpu,代码如下:

import os
os.environ["CUDA_VISIBLE_DEVICES"] = "0"   # 指定第一块gpu

(2)在py文件所在目录,打开终端运行py文件,命令如下:

CUDA_VISIBLE_DEVICES=0 python  main.py       # 终端运行py时,指定gpu 

(3)其它命令,如下:

CUDA_VISIBLE_DEVICES=0 nohup python main.py &     # 终端指定gpu,后台挂起
tailf nohup.out       # 查看nohup里的日志
ps x          # 查看进程

参考

https://blog.csdn.net/weixin_40277254/article/details/89387496

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
搭建Linux深度学习模型训练环境并进行简单测试,你可以按照以下步骤进行: 1. 安装NVIDIA驱动和CUDA工具包: - 首先,检查你的NVIDIA显卡型号,并到NVIDIA官方网站下载对应的驱动程序。 - 禁用开源Nouveau驱动。在终端中执行以下命令: ``` sudo echo "blacklist nouveau" >> /etc/modprobe.d/blacklist.conf sudo echo "options nouveau modeset=0" >> /etc/modprobe.d/blacklist.conf sudo dracut --force ``` - 安装NVIDIA驱动。执行以下命令: ``` sudo bash NVIDIA-Linux-x86_64-<version>.run ``` - 安装CUDA工具包。根据你的显卡型号和操作系统版本,到NVIDIA官方网站下载对应的CUDA工具包,并按照官方文档进行安装。 2. 安装深度学习框架和库: - 选择一个深度学习框架,例如TensorFlow、PyTorch等,并按照官方文档安装相应的库和依赖。 - 通常,你可以使用pip命令来安装深度学习框架和相关库。例如,对于TensorFlow,可以执行以下命令: ``` pip install tensorflow ``` 3. 准备数据集和模型: - 下载所需的数据集,并将其准备好以供训练。 - 根据你的任务,选择一个合适的深度学习模型,并下载相应的预训练权重(如果有)。 4. 编写和训练深度学习模型: - 使用你选择的深度学习框架编写模型训练代码。 - 在代码中,加载数据集、定义模型结构、选择损失函数和优化器等。 - 根据需要,可以使用预训练权重初始化模型,或者从头开始训练模型。 - 执行训练代码,并等待模型训练完成。 5. 进行简单测试: - 使用训练完成的模型进行简单测试,以验证其性能。 - 准备一些测试样本,并使用训练好的模型进行预测或分类。 - 分析预测结果,并评估模型测试数据上的性能指标。 请注意,深度学习模型训练环境的搭建和测试过程可能因具体任务和框架而有所不同。以上步骤提供了一个基本的指导,但你可能需要根据你的需求和环境进行适当的调整。同时,确保你的系统满足所选框架和库的硬件和软件要求。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值