大模型推理引擎国产化思考和实践

京东零售技术

于 2024-12-25 16:22:22 发布

阅读量1.3k

点赞数 31

文章标签：大模型

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zheli1969917/article/details/144722498

版权

本文主要聚焦于大模型推理引擎国产化的重要性与相关背景，文中对比了国产芯片与国际芯片的性能，强调硬件对软件优化的影响。还深入探讨了国产化实践中的挑战与机遇，包括架构比较、性能优化、框架兼容性及模型适配。强调自研推理引擎的必要性，指出与国产芯片适配的重要性及未来发展趋势。

全文目录如下：

1. 背景介绍

2. 国产化思考

3. 国产化实践

4. 未来期望

5. 问答环节

作者：刘童璇京东零售集团总监

01 背景介绍

首先在第一章节中，将简单介绍大模型训练推理中硬件指标与软件适配相关问题的背景，对比国产化芯片与英伟达 GPU 等国际品牌芯片的性能，希望帮助大家理解硬件性能对于大模型训练和推理的重要性。

1. 硬件对比

上图中列出了一些国产化芯片的性能，通过对比英伟达和华为的参数，可以看出国产化芯片在算力、访存和带宽方面的水平，这些是大模型训练推理的关键要素，是软件优化必须考量的硬件指标。

从表中可以看到，华为 910B 尚不支持 FP8 的 TensorCore，其 GPU 内存 64GB，采用 HBM2E 工艺；而英伟达 B100 的 GPU 内存 192GB，采用 HBM3E 工艺。

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。