华为达芬奇AI芯片架构

最新推荐文章于 2025-03-25 01:00:00 发布

yjn18021006815

最新推荐文章于 2025-03-25 01:00:00 发布

阅读量3.7k

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yjn18021006815/article/details/115817123

版权

达芬奇架构是基于AI计算功能设计的，并基于高性能3D Cube计算引擎，极大地提高了计算能力和功耗比。
根据达芬奇架构，进行了以下优化：
在这里插入图片描述
多核堆栈用于并行计算能力扩展
通过设计片上存储器 on-chip memory（高速缓存/缓冲区Cache/Buffer）以缩短Cube操作和存储距离，减少了对DDR的访问，并减轻了冯·诺依曼的瓶颈问题。
在计算和外部存储之间设计了高带宽片外存储器（HBM），以克服计算资源共享存储器的访问速度限制。
为了支持大规模的云侧神经网络训练，设计了超高频段网状网络（LSU），以互连多个多维数据集扩展芯片。
总而言之，达芬奇体系结构具有以下三个features:
**

1. Unified Architecture

支持从tens of milliwatts to hundreds of watts 的全场景AI系列芯片。

2. Scalable Computing

每个AI内核可以在一个时钟周期内完成4096个MAC操作。
灵活的多核堆栈，可扩展的多维数据集：16 x 16 x N，N = 16/8/4/2/1
在训练和推理方案中支持多种混合精度（int8 / int32 / FP16 / FP32）和数据精度要求。
集成张量，矢量和标量计算单位。

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。