pytorch使用指定GPU训练

最新推荐文章于 2024-07-29 07:15:48 发布

ax7399

最新推荐文章于 2024-07-29 07:15:48 发布

阅读量2.1w

点赞数 10

分类专栏：深度学习 python 文章标签： pytorch cuda error out of memory invalid device ordinal

本文链接：https://blog.csdn.net/ax7399/article/details/84557410

版权

深度学习同时被 2 个专栏收录

1 篇文章 0 订阅

订阅专栏

python

1 篇文章 0 订阅

订阅专栏

本文适合多GPU的机器，并且每个用户需要单独使用GPU训练。

虽然pytorch提供了指定gpu的几种方式，但是使用不当的话会遇到out of memory的问题，主要是因为pytorch会在第0块gpu上初始化，并且会占用一定空间的显存。这种情况下，经常会出现指定的gpu明明是空闲的，但是因为第0块gpu被占满而无法运行，一直报out of memory错误。解决方案如下：

指定环境变量，屏蔽第0块gpu

CUDA_VISIBLE_DEVICES = 1 main.py

这句话表示只有第1块gpu可见，其他gpu不可用，此时要注意第1块gpu已经变成第0块，因此代码里应该使用编号0来指定gpu。如果依然使用cuda:1会报invalid device ordinal。
当然也可以在代码里使用os模块达到同样效果：

import os

#多块使用逗号隔开
os.environ['CUDA_VISIBLE_DEVICES'] = '1'

使用torch.cuda.device

with torch.cuda.device(1):
	...

注意这种情况下gpu编号也会改变

关于这个问题的讨论，感兴趣的也可以去这里查看cuda out of memory error when GPU0 memory is fully utilized

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

ax7399

关注关注

10
点赞
踩
48

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

pytorch 指定GPU的几种方法

学-> 思->用

05-31

579

在使用PyTorch时，你可以通过多种方式指定和使用GPU。

pytorch指定用多张显卡训练_Pytorch多GPU训练

weixin_39747807的博客

12-19

639

Pytorch多GPU训练临近放假, 服务器上的GPU好多空闲, 博主顺便研究了一下如何用多卡同时训练原理多卡训练的基本过程首先把模型加载到一个主设备把模型只读复制到多个设备把大的batch数据也等分到不同的设备最后将所有设备计算得到的梯度合并更新主设备上的模型参数代码实现(以Minist为例)#!/usr/bin/python3# coding: utf-8import torchfrom to...

1 条评论您还未登录，请先登录后发表或查看评论

pytorch使用指定GPU训练的实例

01-01

本文适合多GPU的机器，并且每个用户需要单独使用GPU训练。虽然pytorch提供了指定gpu的几种方式，但是使用不当的话会遇到out of memory的问题，主要是因为pytorch会在第0块gpu上初始化，并且会占用一定空间的显存。这种情况下，经常会出现指定的gpu明明是空闲的，但是因为第0块gpu被占满而无法运行，一直报out of memory错误。解决方案如下：指定环境变量，屏蔽第0块gpu CUDA_VISIBLE_DEVICES = 1 main.py 这句话表示只有第1块gpu可见，其他gpu不可用，此时要注意第1块gpu已经变成第0块，因此代码里应该使用编号0来指定

新版PyTorch：AI任务加速与Intel GPU集成

鲁班模锤

07-29

927

Pytorch 2.4 推出AI任务加速，提供对Intel GPU的支持。PyTorch 2.4现在为Intel数据中心GPU Max系列提供支持，该系列将Intel GPU和 SYCL 软件堆栈集成到标准PyTorch 堆栈中

PyTorch中使用指定的GPU

u012759006的博客

09-09

1399

http://www.cnblogs.com/darkknightzh/p/6836568.html

pytorch指定GPU训练模型

qq_25473787的博客

08-31

925

PyTorch默认使用从0开始的GPU，如果默认GPU0正在运行程序，需要指定其他GPU。有如下两种方法来指定需要使用的GPU。类似tensorflow指定GPU的方式，使用CUDA_VISIBLE_DEVICES。直接终端中设定： CUDA_VISIBLE_DEVICES=1 python my_script.py python代码中设定： import os ...

关于torch.cuda.device

qq_25272901的博客

05-15

1097

Torch关于cuda的使用 torch在使用cuda的过程中一定要确定好使用的范围，如module本身，loss，读取数据的部分以及模型中新定义的tensor，需要统一加才可以正常执行

PyTorch指定GPU（很受欢迎）

北国觅梦

08-26

7448

PyTorch指定GPU（最受欢迎）

pytorch指定用多张显卡训练_pytorch使用指定GPU训练的实例

weixin_39707693的博客

12-19

1132

pytorch使用指定GPU训练的实例本文适合多GPU的机器，并且每个用户需要单独使用GPU训练。虽然pytorch提供了指定gpu的几种方式，但是使用不当的话会遇到out of memory的问题，主要是因为pytorch会在第0块gpu上初始化，并且会占用一定空间的显存。这种情况下，经常会出现指定的gpu明明是空闲的，但是因为第0块gpu被占满而无法运行，一直报out of memory错误。...

pytorch 指定gpu训练与多gpu并行训练示例

09-18

总结，PyTorch 提供了简单易用的接口来指定GPU训练和实现多GPU并行训练，这极大地提高了深度学习模型的训练效率。通过合理利用这些功能，开发者可以更高效地利用硬件资源，快速优化和训练复杂的深度学习模型。

python指定Gpu

热门推荐

qimo601的专栏

03-29

2万+

PyTorch默认使用从0开始的GPU，如果GPU0正在运行程序，需要指定其他GPU。有如下两种方法来指定需要使用的GPU。 1. 类似tensorflow指定GPU的方式，使用CUDA_VISIBLE_DEVICES。 1.1 直接终端中设定： CUDA_VISIBLE_DEVICES=1 python my_script.py 1.2 python代码中设定： import os os.environ["CUDA_VISIBLE_DEVICES"] = "2" 见网址：（原）

pytorch指定多块GPU运行代码

flyingluohaipeng的博客

05-26

2027

使用了gpu0,1,2,3 共4块同时跑。

【PyTorch框架】GPU的使用

闪闪发光的博客

04-18

6757

GPU使用；多GPU运算

pytorch指定使用多个GPU

RuanChengfeng的博客

12-04

8406

在pytorch指定使用特定gpu的三种方式。

Pytorch 使用GPU指定卡

m0_60791760的博客

03-03

799

gpu指定卡

使用指定GPU跑Pytorch

skywalker_123的博客

06-06

5655

1、PyTorch默认使用从0开始的GPU，如果GPU0正在运行程序，需要指定其他GPU。有如下两种方法来指定需要使用的GPU。类似tensorflow指定GPU的方式，使用CUDA_VISIBLE_DEVICES。 1.1 直接终端中设定： CUDA_VISIBLE_DEVICES=1 python my_script.py 1.2 python代码中设定： import os ...

pytorch 指定GPU训练

lip

02-25

1万+

指定GPU代码上述使用中，代码3最为常用，keras也可以通过这种方式来调用GPU训练神经网络。 # 代码1： torch.cuda.set_device(1) # 代码2： device = torch.device("cuda:1") # 代码3：（官方推荐使用） os.environ["CUDA_VISIBLE_DEVICES"] = '1' （如果你想同时调用两块GPU的话） os...

python指定gpu运行_pytorch使用指定GPU训练的实例

weixin_39574388的博客

12-05

1263

pytorch训练时指定显卡

m0_61899108的博客

04-28

1万+

1. 利用CUDA_VISIBLE_DEVICES设置可用显卡在CUDA中设定可用显卡，一般有2种方式： (1) 在代码中直接指定 import os os.environ['CUDA_VISIBLE_DEVICES'] = gpu_ids (2) 在命令行中执行代码时指定 CUDA_VISIBLE_DEVICES=gpu_ids python3 train.py 如果使用sh脚本文件运行代码，则有3种方式可以设置 (3) 在命令行中执行脚本文件时指定： CUDA_VISIBLE

pytorch指定gpu进行训练