深度学习——使用GPU

最新推荐文章于 2025-03-30 14:51:55 发布

小奶糕的笔记本

最新推荐文章于 2025-03-30 14:51:55 发布

阅读量2k

点赞数

文章标签：深度学习人工智能 python

本文链接：https://blog.csdn.net/jbkjhji/article/details/128041494

版权

1.查看GPU版本的内容

nvidia-smi

2.计算设备

①查看CPU

import torch
from torch import nn

print(torch.device('cpu'))

输出：cpu

②查看GPU，cuda代表GPU

print(torch.cuda.device('cuda'))

输出

<torch.cuda.device object at 0x000001E1A09CBC70>

③查看GPU的数量

print(torch.cuda.device_count())

3.训练的时候选择CPU还是GPU

def try_gpu(i=0):  # @save
    """如果存在，则返回gpu(i)，否则返回cpu()"""
    if torch.cuda.device_count() >= i + 1:
        return torch.device(f'cuda:{i}')
    return torch.device('cpu')

查看GPU的列表

def try_all_gpus():  # @save
    """返回所有可用的GPU，如果没有GPU，则返回[cpu(),]"""
    devices = [torch.device(f'cuda:{i}')
               for i in range(torch.cuda.device_count())]
return devices if devices else [torch.device('cpu')]

【测试】

①try_gpu()：返回可用的GPU

②try_gpu(10)：没有10块GPU所以返回CPU

①try_all_gpus()：返回所有GPU的列表

4.查询张量的所在设备

x = torch.tensor([1, 2, 3])
print(x.device)

输出：cpu

5.①张量存储在GPU

# 存储在GPU
x = torch.ones(2, 3, device=try_gpu())
Y = torch.rand(2, 3, device=try_gpu())

②在GPU计算X+Y，保证X和Y要在同一块GPU不然报错

print(X+Y)

tensor([[1.8671, 1.9548, 1.6110],
        [1.1859, 1.3689, 1.8437]], device='cuda:0')

6.①用GPU训练神经网络:模型后面调用.to(device)

net = nn.Sequential(nn.Linear(3, 1))
net = net.to(device=try_gpu())
print(net(X))

② 确认模型参数在GPU上

print(net[0].weight.data.device)

输出：cuda:0

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

小奶糕的笔记本

关注关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

从零实现深度学习框架——利用GPU加速(一)

日积月累，天道酬勤

05-18

2750

如何利用GPU加速训练过程

深度学习中 GPU 状态查看

baidu_38307192的博客

10-10

6917

主要内容转载自：https://blog.csdn.net/lien0906/article/details/78863118 一、显存查看方法 1：nvidia-smi Nvidia 显卡命令行管理套件，显示效果如下方法 2：gpustat 使用 pip install gpustat 即可安装，基于 nvidia-smi，可以提供更美观简洁的展示，结合 watch 命令...

参与评论您还未登录，请先登录后发表或查看评论

如何参查看安装的pytorch是CPU还是GPU版

QHCV的博客

06-02

4025

【代码】如何参查看安装的pytorch是CPU还是GPU版。

深度学习篇---模型GPU训练

最新发布

道阻且长，行则将至。

03-30

1260

本文简单介绍了paddlepaddle、pytorch框架下使用GPU进行模型训练的步骤以及注意事项，同时介绍了Openmp以及相应问题的解决。

动手学深度学习之GPU使用

Trony的博客

08-16

1201

!nvidia-smi Mon Aug 16 14:23:34 2021 +-----------------------------------------------------------------------------+ | NVIDIA-SMI 430.26 Driver Version: 430.26 CUDA Version: 10.2 | |-------------------------------+------------------

如何判断自己是在使用cpu还是gpu跑代码

weixin_46428351的博客

06-07

2万+

如何判断自己是在使用cpu还是gpu跑代码在Linux系统下，可以通过在终端中输入一句命令来查看自己跑的代码是在用CPU还是GPU： nvidia-smi 举例：上图可以看出，GPU利用率为5%，当前代码是在使用cpu。上图可以看出，GPU利用率为83%，当前代码是在使用gpu。除此以外，使用该句命令也可以查看自己的gpu版本和cuda版本。具体每个参数代表什么意思，可以通过参考这篇文章https://blog.csdn.net/a784586/article/details/7868884

动手学习深度学习（总结梳理）——10. GPU的使用

weixin_44981126的博客

10-16

3611

动手学习深度学习（总结梳理）——10. GPU的使用

基于Pytorch深度学习——GPU安装/使用

EchoToMe的博客

05-03

1308

本文章来源于对`李沐动手深度学习`代码以及原理的理解，并且由于李沐老师的代码能力很强，以及视频中讲解代码的部分较少，所以这里将代码进行尽量**逐行详细解释** 并且由于pytorch的语法有些小伙伴可能并不熟悉，所以我们会采用**逐行解释+小实验的方式**来给大家解释代码基于Pytorch深度学习——GPU的安装和使用，并且讲解了device.count()为0的解决方案

吴茂贵等人著《Python深度学习——基于PyTorch》书籍代码.zip

05-09

《Python深度学习——基于PyTorch》是一本深入探讨Python深度学习技术的著作，由吴茂贵等专家撰写。本书的核心是围绕PyTorch这一强大的深度学习框架进行讲解，旨在帮助读者掌握使用Python进行深度学习的实践技能。...

深度学习——手把手教你安装Anaconda开发环境.rar

04-28

本教程《深度学习——手把手教你安装Anaconda开发环境》将指导你轻松完成安装过程，让你快速步入深度学习的世界。首先，你需要访问Anaconda的官方网站，下载适用于你操作系统的最新版本。Windows、Mac OS和Linux用户...

深度学习——从神经网络到模型部署.pdf

03-28

【深度学习——从神经网络到模型部署】 深度学习是机器学习的一个分支，它主要通过模拟人脑神经网络的结构和功能来实现复杂的学习任务。在深度学习中，神经网络是核心构建块，由大量的人工神经元组成。神经元是模型...

深度学习——多GPU训练代码实现

jbkjhji的博客

12-15

1825

一台机器有K个GPU，给定训练模型，每个GPU参数值是相同且同步，每个GPU独立地维护一组完整地模型参数。k=2时数据并行地训练模型，利用两个GPU上的数据，并行计算小批量随机梯度下降。3.数据分发：将小批量的数据均匀的分布给多个GPU，同时拆分数据和标签split_batch函数。①任何一次训练迭代中，给定的随机小批量样本分成K个部分，均分分给GPU。②每个GPU根据分配它的小批量子集，计算模型参数的损失和梯度。③将K个GPU中的局部梯度聚合，获得当前小批量的随机梯度。①小批量上实现多GPU训练。

【动手学深度学习PyTorch版】11 使用GPU

水w的博客

10-25

6206

使用GPU

《动手学深度学习 Pytorch版》 5.6 GPU

AncilunKiang的博客

09-17

461

（3）测量计算 1000 个 100*100 矩阵乘法所需的时间，并记录输出矩阵的弗罗贝尼乌斯范数，一次记录一个结果，而不是在GPU上保存日志并进传输最终结果。（1）尝试一个计算量很大的任务，比如大矩阵的乘法，看看CPU和GPU的速度差异。（4）测量同时在两个 GPU 上执行两个矩阵乘法与在一个 GPU 上按顺序执行两个矩阵乘法所需的时间。需要执行运算的数据需要在同一块GPU上，如果不在则可以复制过去。谨慎复制，并行化的瓶颈在于数据传输而不是运算速度。（2）我们应该如何在GPU上读写模型参数？

李沐《动手学》-使用GPU

qq_36136196的博客

07-10

943

文章目录1.查看gpu2.张量与gpu3.神经网络与gpu 1.查看gpu nvidia-smi watch -n 1 nvidia-smi#一秒刷新一次 import torch from torch import nn torch.device('cpu'), torch.cuda.device('cuda'), torch.cuda.device('cuda:1') #查询gpu数量 torch.cuda.device_count() 自定义的两个简洁函数 def try_gpu(i=0):

动手学PyTorch（李沐）10 ---- GPU使用

qq_46381729的博客

08-25

245

数据在GPU上，操作运算就要在GPU上完成，要保证手动copy到GPU上，如果有多个GPU的话，也要使得数据和模型在同一个GPU上。通常在cpu上把权重初始化好，然后调用 .to 方法把层（所有参数）移动到gpu上，y也在当前gpu上。计算是在同一gpu上计算，从gpu移动数据到cpu是一件很慢的事情。允许我们在请求的GPU不存在的情况下用CPU运行代码。查询张量所在的设备，在gpu上创建tensor。计算t+y，需要决定在哪里执行操作。在第二个gpu创建张量。

检查虚拟环境中Pytorch的版本，判断安装的pytorch是GPU版本还是CPU版本，查看CUDA可用数量，查看CUDA版本

热门推荐

m0_56182552的博客

09-21

3万+

或者使用nvidia-smi，也可以查看CUDA的版本。True代表是GPU版本，False代表是CPU版本。一、检查虚拟环境中Pytorch的版本。三、查看可用的CUDA数量。2.输入python。

如何确定模型训练时是否使用了GPU训练

Kirihara_Yukiho的博客

07-05

4816

在我们进行模型训练时，我们可能会疑惑代码什么的都已经进行了设置，到底在训练时是否用到了GPU训练呢？如果红色箭头为0%，表示没有用到gpu进行模型训练。本次学习交流就到此为止了，希望可以帮到你。而下面这个就是用到了GPU训练。2.输入nvidia-smi。1.win+r 输入cmd。

CUDA 运行时GPU信息查询

Jane_yuhui的专栏

10-14

406

cuda 官网文档名：CUDA_Runtime_API。

深度学习怎么使用GPU

03-08

### 配置和使用GPU加速训练 #### 安装CUDA Toolkit 对于希望在MATLAB中实现高效GPU加速深度学习模型训练的用户来说，安装适合特定GPU型号的CUDA Toolkit是必要的前提条件[^1]。 #### 设置环境变量完成CUDA Toolkit的安装之后，正确配置环境变量至关重要。这涉及到更新系统的`PATH`以及`LD_LIBRARY_PATH`等环境变量以便操作系统能够识别CUDA的相关库文件位置。 #### 验证安装成功与否为了确认CUDA Toolkit已经成功部署，在终端执行`nvcc --version`命令可用来检验版本信息从而判断安装过程是否顺利完成。 #### 支持GPU加速的功能列表 - **Deep Learning Toolbox** 提供了一系列可以直接调用以启用GPU运算的支持函数；不过具体的可用功能并未在此处详尽列出。 - **Parallel Computing Toolbox** 则进一步扩展了这一能力范围至超过700个不同的内置方法之上——这其中涵盖了诸如离散傅立叶变换、矩阵相乘操作乃至左侧矩阵除法等多种常见线性代数处理任务。 - 此外还存在一种名为“Deep Learning容器”的机制允许借助于集成好的CUDA驱动程序来进行更便捷快速地开发工作流设计。 #### 多GPU并行训练策略当面对更大规模的数据集或是更为复杂的网络结构时，则可能需要用到多个图形处理器协同工作的模式下开展实验研究活动。MATLAB提供了相应API接口使得开发者可以通过编写脚本来定义跨设备间数据交换逻辑进而达成目的。 ```matlab % 创建一个分布式数组用于多GPU间的通信协作 d = gpuArray.ones(1e3,'distributed'); % 使用parfor循环来分配不同部分的任务给各个节点上的GPU去独立完成 parfor i=1:4 % 假设这里有一些针对单张图片的操作... end; ```