GPU在大模型中是怎么工作的？

最新推荐文章于 2024-08-01 20:59:33 发布

shengyin714959

最新推荐文章于 2024-08-01 20:59:33 发布

阅读量125

点赞数 6

分类专栏：笔记最高笔记文章标签：人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/shengyin714959/article/details/140786437

版权

笔记同时被 2 个专栏收录

1313 篇文章 73 订阅 ¥19.90 ¥99.00

订阅专栏

超级会员免费看

469 篇文章 1 订阅 ¥299.90 ¥399.90

订阅专栏

超级会员免费看

现如今，当我们提及深度学习时，人们自然而然地会联想到通过 GPU 来增强其性能。

GPU（图形处理器，Graphical Processing Units）起初是为了加速图像（images）及 2D、3D 图形（graphics）的渲染而生。但凭借其强大的并行运算能力，GPU 的应用范围迅速拓展，已扩展至深度学习（deep learning）等应用领域。

GPU 在深度学习模型中的应用始于 2000 年代中后期，2012 年 AlexNet 的横空出世更是将这种趋势推向高潮。 AlexNet，这款由 Alex Krizhevsky、Ilya Sutskever 和 Geoffrey Hinton 共同设计、研发的卷积神经网络，在 2012 年的 ImageNet Large Scale Visual Recognition Challenge (ILSVRC) 上一鸣惊人。这一胜利具有里程碑式的意义，它不仅证实了深度神经网络在图像分类领域（image classification）的卓越性能，同时也彰显了使用 GPU 训练大型模型的有效性。

在这一技术突破之后，GPU 在深度学习模型中的应用愈发广泛，PyTorch 和 TensorFlow 等框架应运而生。

如今，我们只需在 PyTorch 中轻敲 .to(“cuda”)，即可将数据传递给 GPU，从而加速模型的训练。但在实践中，深度学习算法究竟是如何巧妙地利用 GPU 算力的呢？让我们一探究竟吧！

深度学习的核心架构，如神经网络、CNNs、RNNs 和 transformer，其本质都围绕着矩阵加法（matrix addition）、矩阵乘法（matrix multipli

了解本专栏

超级会员免费看

关注

6
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
GPU在大模型中是怎么工作的？

鉴于 CUDA kernels 的工作空间为 device 的内存（device memory），故需向 kernel 提供 device 指针（device pointers）（d_A、d_B 和 d_C），以确保其能在 device 的内存上运行。对于深度学习模型而言，其实质就是一系列涉及矩阵（matrix）与张量（tensor）的运算操作，包括但不限于求和（sum）、乘法（multiplication）、卷积（convolution）以及归一化（normalization ）等。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

shengyin714959 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。