一块GPU搞定ChatGPT；ML系统入坑指南；理解GPU底层架构

OneFlow深度学习框架

已于 2023-02-24 14:38:17 修改

阅读量1.1w

点赞数 4

分类专栏：前沿技术文章标签： chatgpt 人工智能 OpenAI GPU 机器学习

于 2023-02-23 08:03:43 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/OneFlow_Official/article/details/129188307

版权

本文集合了关于ChatGPT及其技术的多个话题，包括利用FlexGen技术降低大型语言模型推理的GPU需求，探讨ChatGPT数据集、经济成本、技术重点，以及GPU底层架构和机器学习系统的入坑指南。同时，文章还讨论了GPU在矩阵运算和CUDA编程中的应用，以及新优化器对深度学习效率的影响。

摘要由CSDN通过智能技术生成

1. 跑ChatGPT体量模型，从此只需一块GPU

在发展技术，让大模型掌握更多能力的同时，也有人在尝试降低AI所需的算力资源。最近，一种名为FlexGen的技术因为「一块RTX 3090跑ChatGPT体量模型」而获得了人们的关注。

虽然FlexGen加速后的大模型看起来仍然很慢 —— 跑1750亿参数的语言模型时每秒1个token，但令人印象深刻的是，它已经把不可能变成了可能。传统上，大型语言模型（LLM）推理的高计算和内存要求使人们必须使用多个高端AI加速器进行训练。本研究探索了如何将LLM推理的要求降低到一个消费级GPU并实现实用性能。

链接：

https://mp.weixin.qq.com/s/ZdW_jZov3bAcGc_9SqiL-A

2. ChatGPT数据集之谜

至今，OpenAI并没有公开ChatGPT的相关训练数据集来源和具体细节，一定程度上也暂时卡了追赶者的脖子，更何况，业界公认中文互联网数据质量堪忧。本文作者则整理分析了2018年到2022年初从GPT-1到Gopher的相关大型语言模型的所有数据集相关信息，希望帮助有志于开发“类ChatGPT”模型的团队少走一步弯路。

链接：

https://mp.weixin.qq.com/s/9vOc-OyqvzrO_w5LApurbg

3. ChatGPT背后的经济账

ChatGPT能否取代Google、百度这样的传统搜索引擎？为什么中国不能很快做出ChatGPT？当前，对这些问题的探讨大多囿于大型语言模型（LLM）的技术可行性，忽略或者非常粗糙地估计了实现这些目标背后的经济成本，从而造成对LLM的开发和应用偏离实际的误判。

本文作者从经济学切入，详细推导了类ChatGPT模型搜索的成本、训练GPT-3以及绘制LLM成本轨迹的通用框架，为探讨LLM成本结构和其未来发展提供了可贵的参考视角。

链接：

https://mp.weixin.qq.com/s/aAg1ptEkQ6ahdjs-3s_g3A

4. 解读ChatGPT背后的技术重点：RLHF、IFT、CoT、红蓝对抗

最低0.47元/天解锁文章

OneFlow深度学习框架

关注

4
点赞
踩
18

收藏

觉得还不错? 一键收藏
0
评论
一块GPU搞定ChatGPT；ML系统入坑指南；理解GPU底层架构

1. 跑ChatGPT体量模型，从此只需一块GPU在发展技术，让大模型掌握更多能力的同时，也有人在尝试降低AI所需的算力资源。最近，一种名为FlexGen的技术因为「一块RTX 3090跑ChatGPT体量模型」而获得了人们的关注。虽然FlexGen加速后的大模型看起来仍然很慢 —— 跑1750亿参数的语言模型时每秒1个token，但令人印象深刻的是，它已经把不可能变成了可能。传统上，大型语言模型...
复制链接

扫一扫

专栏目录

OneFlow深度学习框架 CSDN认证博客专家

CSDN认证企业博客

341: 原创

1万+: 周排名

6330: 总排名

178万+: 访问

: 等级

4811: 积分

5375: 粉丝

2042: 获赞

428: 评论

3202: 收藏

私信

关注

热门文章

分类专栏

最新评论

比肩Midjourney-v6！没有GPU也能跑可图Kolors
yixiaoyou0079: 快手真棒
OpenAI首席科学家：通向无监督学习之路
K_Code_King: 主要是知识储备，他很多话背后都隐藏着很多深度的思考和知识，不具备足够的知识储备，根本理解不了
SiliconCloud公测上线，每人免费送3亿Token
OneFlow深度学习框架: 可说呢，OpenAI的模型是最强的
SiliconCloud公测上线，每人免费送3亿Token
BossFriday: 简单试用了下文本对话，文生成图。和OpenAI对比起来差很多，不过都还是能用的。
LLaMA 3：大模型之战的新序幕
YesPMPYesPMP: 互联网众包平台Yespmp，帮助项目实现落地。平台提供全方位的服务，包括IT项目开发、运营推广、创意设计、灵活用工等多个领域。它为项目发包方和接包服务商提供了一个交流和合作的平台，帮助双方找到合适的合作伙伴，解决项目管理中的各种痛点，如项目风险高、成本和进度控制困难等。同时，平台还提供项目监理、开发工具包、虚拟课堂等支持，帮助项目从设计到开发再到运营的整个周期顺利实施。

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。