Deepseek使用PTX的好处

最新推荐文章于 2025-02-18 11:24:11 发布

AI-AIGC-7744423

最新推荐文章于 2025-02-18 11:24:11 发布

阅读量1k

点赞数 3

分类专栏： PTX在DeepSeek中作用与意义文章标签：人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/2301_80471322/article/details/145402790

版权

PTX在DeepSeek中作用与意义专栏收录该内容

5 篇文章

订阅专栏

从某种意义上来说，DeepSeek可以认为是绕过了CUDA，主要体现在以下方面：

• 采用PTX语言优化：DeepSeek在训练DeepSeek - V3时，没有使用CUDA，而是采用英伟达的PTX语言进行优化，针对自身需求对硬件的流式多处理器进行了重新配置，变相绕过了硬件对通信速度的限制。

• 降低对CUDA依赖：通过直接使用PTX，DeepSeek减少了对CUDA高级编程语言的依赖，直接在更接近底层硬件的层面进行操作，实现了算法与硬件的直接对接，降低了开发成本，显著提升了计算效率。

• 展现跨平台潜力：DeepSeek已经与AMD、华为等团队紧密合作，第一时间提供了对其他硬件生态的支持，这表明其不依赖CUDA也能在不同硬件平台上进行高效开发和应用，展现出一定的跨平台潜力。

但严格来说，PTX仍然是英伟达GPU架构中的技术，是CUDA编程模型中的中间表示。在实际编译流程中，CUDA代码首先被编译为PTX代码，PTX代码再被编译为目标GPU架构的机器码。所以DeepSeek的操作并非完全脱离英伟达的技术体系，只是在一定程度上突破了CUDA的限制。

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。