在linux下用终端训练和测试模型

最新推荐文章于 2024-07-31 22:18:15 发布

liz_lee

最新推荐文章于 2024-07-31 22:18:15 发布

阅读量970

点赞数

本文链接：https://blog.csdn.net/liz_Lee/article/details/106917352

版权

深度学习专栏收录该内容

26 篇文章 3 订阅

订阅专栏

步骤

(1)在python中,指定要使用的gpu,代码如下:

import os
os.environ["CUDA_VISIBLE_DEVICES"] = "0"  　# 指定第一块gpu

(2)在py文件所在目录,打开终端运行py文件,命令如下:

CUDA_VISIBLE_DEVICES=0 python  main.py       # 终端运行py时,指定gpu

(3)其它命令,如下:

CUDA_VISIBLE_DEVICES=0 nohup python main.py &     # 终端指定gpu,后台挂起
tailf nohup.out       # 查看nohup里的日志
ps x          # 查看进程

参考

https://blog.csdn.net/weixin_40277254/article/details/89387496

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

liz_lee

关注关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

terminalForCoder__WSD：练习库* nix终端（Ubuntu首选）

02-06

terminalForCoder__WSD 练习库* nix终端（Ubuntu首选）文章（英文） Статьи（RU）幻灯片（EN） Слайды（RU）如何使用它做git clone东西 $ git clone git@github.com:var-bin/terminalForCoder__WSD.git 请享用 :laptop_computer: 主题清单码头经理 screen 安装 screen配置文件基本按键组合这个怎么运作 tmux 安装基本按键组合这个怎么运作 screen vs tmux bash 基本的变数将参数传递给脚本在

终端训练模型指令

weixin_40277254的博客

04-18

780

在终端执行程序时指定GPU CUDA_VISIBLE_DEVICES=0 python your_file.py # 指定GPU集群中第一块GPU使用,其他的屏蔽掉在python代码中指定GPU import os os.environ["CUDA_VISIBLE_DEVICES"] = "0" 　#指定第一块gpu 终端指定GPU，后台挂起 CUDA_VISIBLE_DE...

参与评论您还未登录，请先登录后发表或查看评论

llama-factory 系列教程 (六)，linux shell 脚本自动实现批量大模型的训练、部署与评估

最新发布

jieshenai的博客

07-31

1060

使用linux shell 脚本，自动化批量处理大模型的微调、部署与评估。无需人工逐个交互处理，减少人工的精力和时间。

python训练模型测试模型_Tensorflow实现在训练好的模型上进行测试

weixin_39906130的博客

11-20

608

Tensorflow可以使用训练好的模型对新的数据进行测试，有两种方法：第一种方法是调用模型和训练在同一个py文件中，中情况比较简单；第二种是训练过程和调用模型过程分别在两个py文件中。本文将讲解第二种方法。模型的保存tensorflow提供可保存训练模型的接口，使用起来也不是很难，直接上代码讲解：?1234567891011121314151617#网络结构w1= tf.Variable(tf....

Linux服务器环境下调用pytorch训练好的模型问题

zhenyu_zhang的博客

04-13

510

报错“CUDNN_STATUS_NOT_INITIALIZED” 在一个服务器上两GPU显卡块卡，用卡1进行模型训练，用如下代码并保存训练好的模型 torch.save(model,ModelPath) 在测试时使用如下代码调用训练好的模型： pkl_model = torch.load(ModelPath) if use_cuda: net_loaded = pkl_model.cuda() if use_cuda: data = data.cuda() predict = net.

linux测试教程怎样学,训练和测试自己的图片 - Caffe 深度学习入门教程_Linux教程_Linux公社-Linux系统门户网站...

weixin_31894867的博客

05-07

111

训练和测试自己的图片学习caffe的目的，不是简单的做几个练习，最终还是要用到自己的实际项目或科研中。因此，本文介绍一下，从自己的原始图片到lmdb数据，再到训练和测试模型的整个流程。一、准备数据有条件的同学，可以去imagenet的官网http://www.image-net.org/download-images，下载imagenet图片来训练。但是我没有下载，一个原因是注册账号的时候，验证码...

基于HuggingFace开发的大语言模型训练

10-24

1. **WebUI和终端预测**：这表明该工具不仅可以在命令行界面（CLI）下运行，还提供了一个图形用户界面（GUI），使得用户可以通过网页进行模型的训练和测试，这对于非程序员或者想要直观交互的用户来说非常友好。...

如何搭建Linux深度学习模型训练环境，并简单测试

07-13

搭建Linux深度学习模型训练环境并进行简单测试，你可以按照以下步骤进行： 1. 安装NVIDIA驱动和CUDA工具包： - 首先，检查你的NVIDIA显卡型号，并到NVIDIA官方网站下载对应的驱动程序。 - 禁用开源Nouveau驱动。...

机器学习初步——TensorFlow在Linux操作系统下安装的整个过程（包括IDE）

04-27

在机器学习领域，TensorFlow是一个不可或缺的工具，它是一个基于数据流编程的开源库，用于构建和训练复杂的机器学习模型。TensorFlow源自谷歌的DistBelief项目，旨在提供更加高效和灵活的平台，支持各种机器学习算法...

Linux下使用Caffe自己制作数据、并训练手写数字识别模型（python版）

Pointer的博客

08-04

1419

一：训练模型第一步：下载MNIST数据集在Linux的终端输入： wget http://deeplearning.net/data/mnist/mnist.pkl.gz 原版mnist数据集下载比较慢，所以使用这个bengio组封装好的数据包。第二步：处理数据集（显示数据 - 图片）（1）使用python下载数据集并转换成图片 # encoding: utf-...

Ubuntu使用darknet实现YOLOv4-tiny预训练模型测试+训练自己的数据集+评估自己的模型

Xavier的博客

12-27

6379

文章目录1.编译darknet2.训练3.测试 YOLOv4-tiny的原理本文暂时不讲，只有应用 1.编译darknet 1.在GitHub网址https://github.com/AlexeyAB/darknet下载最新版的darknetAB源码参考博客：Yolo v4系列学习（五）Yolov4-tiny ./darknet detector test ./cfg/coco.data cfg/yolov4-tiny.cfg yolov4-tiny.weights data/dog.jpg # 图片测试

训练神经网络的tricks——收集Linux终端网络模型训练日志screen指令

千与编程

11-08

360

之前我曾经写过一次关于如何使用服务器进行神经网络模型训练的博客，有兴趣的可以翻出来看看今天我想介绍的是源于我下面的一种的训练情况：训练一个神经网络模型，需要2天2夜，我不仅仅需要最后一个模型的模型性能指标，还需要中间几个的模型训练参数，如果们使用tmux进行开放进程进行模型的训练。这时候我们就需要使用screen指令将Linux的终端输出的日志进行收集生成一个文件在进行模型训练之前，运行指令： script screen.log 运行完上述指令后表示日志文件已经开始收集终端的输出log 执行网

ubuntu终端入门

飞奔的波大爷的博客

06-04

766

上章学习了如何在windows7下安装虚拟机，及在虚拟机上安装ubuntu（linux）系统。本章介绍如何简单使用ubuntu终端，linux命令。 ubuntu在虚拟机上的安装： http://blog.csdn.net/qq_22860341/article/details/72832585打开ubuntu系统，ctrl+alt+T打开终端即可输入命令了。 2,命令的学习（1）p

ubuntu16.04练习笔记

w75759723的博客

05-08

269

1>图形化界面和命令行界面的切换:alt+ctrl+F1到F6(因为在Linux中一般有F1到F6多个命令行字符终端，也就是说我们可以同时打开最多6个命令行界面)

2021-7-14 深度学习服务器Linux终端网络训练training（顶会ECCV网络BiSeNet）

橙子Blue不加冰

07-14

375

Linux终端执行：通过readme.md文件的指示：终端执行以下文件： bisenetv1 cityscapes Linux命令如下： export CUDA_VISIBLE_DEVICES=0,1 cfg_file=configs/bisenetv1_city.py NGPUS=2 python -m torch.distributed.launch --nproc_per_node=$NGPUS tools/train_amp.py --config $cfg_file ※ 注意以下问题： 1

linux下模型训练常用操作指令

weixin_42059276的博客

06-09

1198

ubuntu下模型训练常用操作查看anaconda版本查看ubuntu版本查看显卡驱动版本号查看TensorFlow版本验证tensorflow-gpu是否安装成功查看python版本查看gpu运行情况查看cuda版本查看系统cuda安装版本查看自己的anaconda下cuda版本查看cudnn版本查看系统cudnn安装版本查看自己的anaconda下cudnn版本查看anaconda版本 conda --version 查看ubuntu版本 cat /proc/version 查看显卡驱动版本号 c

Liunx上训练模型的常见情况（不定期更新）

呆萌的代Ma

03-01

1344

这篇博客用来记录一些Linux上后台训练机器学习模型的时候可能用到的简短的代码（不定期更新）目录：后台执行python训练脚本查看训练时占用的资源中途停止模型的训练 1.后台执行python训练脚本 nohup python脚本.py& 比如 nohup python word2vec_model.py & 如果只用 python 脚本.py&am...

tensorflow笔记：训练模型的时候如何指定GPU进行训练

AI新视界

12-11

2973

目录一、Linux查看Nvidia显卡信息及使用情况二、第一种是通过tf.device()函数来指定训练时所要使用的GPU 三、通过CUDA_VISIBLE_DEVICES来指定四、tensorflow的显卡使用方式 1、直接使用 2、分配比例使用 3. 动态申请使用 4 指定GPU 一、Linux查看Nvidia显卡信息及使用情况 Nvidia自带一个命令行工具可以查看...

学习神经网络常用的Linux指令

zxc120389574的博客

11-20

432

conda Anaconda 1）conda list：查看安装了哪些包。 2）conda env list 或 conda info -e：查看当前存在哪些虚拟环境 3）conda update conda：检查更新当前conda 创建Python虚拟环境： # 只安装python基础包 conda create -n env_name python=2.7 # 同时安...