Nvidia GPU 教程之基于Tesla P40 上的自然语言处理

知识大胖

于 2022-10-08 14:31:51 发布

阅读量2.3k

点赞数

分类专栏： NVIDIA GPU和大语言模型开发教程文章标签： sql 数据库 java

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/iCloudEnd/article/details/127208213

版权

NVIDIA GPU和大语言模型开发教程专栏收录该内容

该专栏为热销专栏榜第88名

810 篇文章 240 订阅 ¥89.90 ¥99.00

订阅专栏

介绍

自然语言处理 (NLP) 是计算机科学的一个子领域，涉及人类与计算机之间的交互，使用自然人类语言。它是语言学和人工智能 (AI) 的一个子领域，提供了直到几年前我们才具备的潜力。

GPT-J-6B 是一个拥有 60 亿参数的 NLP 大型模型，由 EleutherAI [1] 构建并通过 Hugging Face 社区开源。[2]

该模型具有令人印象深刻的能力、创造力和预测能力。然而，加载像 GPT-J-6B 这样的大型 NLP 模型需要具有挑战性的硬件设置，并且至少需要有关其内部结构和推理方法的基本知识。

在本文中，我将解释构建消费级硬件以加载模型的基本步骤以及如何与之交互。这并不是一个循序渐进的教程，但即使您非常熟悉这个概念，本文也可能会提供有用的建议。

在 Nvidia Tesla P40 上运行 GPT-J-6B 模型

由于精度和时间的损失，将模型加载到 CPU 上是不切实际的。6B 模型需要大量的 CUDA 内核才能以高效的速度准确运行，至少需要 35GB 的 CPU 内存和 23GB 的 GPU 内存，这些内存必须是连续的且不能碎片化。
CUDA 内核必须可以直接访问 GPU 内存，而不会出现其他视频处理中断。

该项目首次在 Nvidia Tesla P40 加速器上进行演示。二手产品市场提供三种加速器，以 24GB GPU 和 CUDA 兼容的形式出售；那些是：

Nvidia Tesla K80 Kepler 架构，24GB GDDR5 显存
Nvidia Tesla M40 Maxwell 架构，24GB GDDR5 显存
Nvidia Tesla P40 Pascal 架构，24GB GDDR5

了解本专栏

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
打赏
0
评论
Nvidia GPU 教程之基于Tesla P40 上的自然语言处理

自然语言处理 (NLP) 是计算机科学的一个子领域，涉及人类与计算机之间的交互，使用自然人类语言。它是语言学和人工智能 (AI) 的一个子领域，提供了直到几年前我们才具备的潜力。GPT-J-6B 是一个拥有 60 亿参数的 NLP 大型模型，由 EleutherAI [1] 构建并通过 Hugging Face 社区开源。[2]该模型具有令人印象深刻的能力、创造力和预测能力。然而，加载像 GPT-J-6B 这样的大型 NLP 模型需要具有挑战性的硬件设置，并且至少需要有关其内部结构和推理方法的基本知识。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

知识大胖 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。