GPU cuda cuDNN pytorch理解

最新推荐文章于 2024-06-08 09:33:02 发布

啥也不是的py人

最新推荐文章于 2024-06-08 09:33:02 发布

阅读量560

点赞数 2

分类专栏： # pytorch 文章标签： python 人工智能 windows

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_50920579/article/details/126466120

版权

pytorch 专栏收录该内容

11 篇文章 0 订阅

订阅专栏

目录

参考：

GPU/ CUDA/ cuDNN_哔哩哔哩_bilibili

gpu vs cpu

显卡就是一块负责承担输出图形任务的板卡

gpu就是显卡上的一块芯片，是显卡的核心

gpu能够减少显卡对cpu的依赖，分担部分cpu的工作

gpu是高度并行的结构，所以在部分情况下他更高效

通常来说cpu里只有几个算储单元（绿色+黄色+紫色）

但是gpu却有非常多（注意看gpu最左侧一列）

cuda

简单来说

cuda提供了一个能够让gpu高速并行计算的代码书写规范，使得我们可以将计算更加灵活地拆解成一个个子任务，然后分配到不同的线程上，提高并发性

例子：

上面的例子是两部分

分别是kernel的定义和main函数

kernel的定义和普通的c++函数没有什么区别，除了加上了一个__global__的修饰符，这个修饰符就相当于告诉编译器这部分需要在gpu上完成

这部分就是把两个长度为N的向量，将其分配到N个线程上进行加法运算，那其实每个线程只需要计算相应位置上的一个加法运算就可以了

这里用到了threaddx.x这个内置变量，它是线程的一个标号N个线程的标号就是从0到N-1

刚好满足运算需求

<<<1,N>>>代表调用第一个到第N个线程来进行计算

补全代码

1.在host端初始化需要进行加法运算的两个向量

2.将host端的数据拷贝到device端

3.在device端进行计算

4.将device端的计算结果拷贝回host端

最后就可以用nvcc（也就是cuda编译器）

编译.cu文件，然后就会得到一个可执行文件

所以实际上数据是在host端产生，然后拷贝到gpu上进行计算的，最后再将数据拷贝回host端

cuDNN

为了让使用者不用实现底层的cuda编程，cuDNN就产生了

cuDNN就是cuda深度神经网络库，就是将一些基本的层结构进行封装

实现了在GPU上的高效并行计算

可理解为cv2库，对常用的图像处理算法封装成了库里的很多函数，用的时候直接调用，而不使用python从头写造轮子

pytorch

torch在此之上再次进行封装

torch利用cuda和cuDNN来利用gpu进行加速

经常能见到以下类似代码

首先我们定义一个device

然后就会有net=model().to(device)

以及x.to(device)和y.to(device)

所以实际上这一步就是将host端的数据拷贝到GPU上进行运算

所以只要把.to(device)就可以加速

可以看到device端的数据和host端的数据互不干扰

b是a拷贝到gpu上的，然后改变a并不会改变b，说明是相互隔离的两个变量

更多相关的内容可以看以下文档

啥也不是的py人

关注

2
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
GPU cuda cuDNN pytorch理解

kernel的定义和普通的c++函数没有什么区别，除了加上了一个__global__的修饰符，这个修饰符就相当于告诉编译器这部分需要在gpu上完成。这部分就是把两个长度为N的向量，将其分配到N个线程上进行加法运算，那其实每个线程只需要计算相应位置上的一个加法运算就可以了。可理解为cv2库，对常用的图像处理算法封装成了库里的很多函数，用的时候直接调用，而不使用python从头写造轮子。所以实际上数据是在host端产生，然后拷贝到gpu上进行计算的，最后再将数据拷贝回host端。
复制链接

扫一扫

专栏目录

啥也不是的py人 CSDN认证博客专家 CSDN认证企业博客

码龄4年

177: 原创

1720: 周排名

1万+: 总排名

42万+: 访问

: 等级

2532: 积分

3万+: 粉丝

544: 获赞

166: 评论

2426: 收藏

私信

关注

热门文章

分类专栏

机器人 1篇
vrep 9篇
ros 31篇
pybullet 13篇
issacgym 2篇
mujoco 4篇
编程语言
python 31篇
c 5篇
机器学习 1篇
Transformer 2篇
PointCloud 8篇
pytorch 11篇
yolo 5篇
colab 1篇
环境创建 7篇
运维 14篇
docker 1篇
cv 3篇
bim 5篇
前端 9篇
硬件 2篇
力学 1篇

最新评论

AttributeError: Can‘t get attribute ‘SPPF‘ on ＜module ‘models.common‘ from ‘H:\\yolov5-5.0\\models\\
是purity了: name 'nn' is not defined 复制进去没定义怎么办
python读取txt数据
xin_super: 确实是大佬
Torch车牌字符识别-网络搭建（五）
纽约恋情: 请教一下源码
pybullet-GGCNN神经网络搭建及训练（四）
BOSO: 请教一下，自己制作的数据集，训练出来的结果，迭代200次的结果accuracy全是0是什么原因呢？200次结果都类似下面这样的： INFO:root:Beginning Epoch 00, lr=1e-05 INFO:root:Epoch: 0, Batch: 1/1, loss_pos: 0.25030, loss_cos: 1.16631, loss_sin: 0.03136, loss_wid: 0.14784, Loss: 1.59581 INFO:root:>>> Validating... Validating... 1.00 >>> test_graspable = 0.55629 >>> test_accuracy: 0.000000 Validating... 1.00 >>> train_val_graspable = 0.55629 >>> train_val_accuracy: 0.000000 >>> save model: epoch_0000_acc_0.0000.pth
AttributeError: Can‘t get attribute ‘SPPF‘ on ＜module ‘models.common‘ from ‘H:\\yolov5-5.0\\models\\
m0_71261970: tags5是什么东西在哪

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。