华为达芬奇

最新推荐文章于 2025-03-25 01:00:00 发布

崔林繁

最新推荐文章于 2025-03-25 01:00:00 发布

阅读量2.3k

点赞数

本文链接：https://blog.csdn.net/u012363389/article/details/101755606

版权

华为的达芬奇架构基于ARM，为通用处理器添加AI加速功能，如在麒麟810芯片中的应用。达芬奇核心设计理念是提高AI能效，采用3D Cube技术加速矩阵运算，支持不同配置。Ascend 910 AI芯片提供高计算密度，用于大规模分布式训练系统。架构还包括可拓展的计算、内存和互连，以及高效的内存层次结构减少DDR带宽需求。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

达芬奇架构依然是基于ARM架构，是在ARM架构的基础上研发的AI硬件处理单位，它不是ARM处理器，而是与之配合，为通用处理器添加AI加速器功能。华为的麒麟810芯片采用的是达芬奇NPU,也就是传统的ARM核+AI加速器的模式。当然，这个AI加速器是达芬奇NPU的核心，他把MAC按照不同的计算组成不同的方式，搭配标准的数据缓存，进行AI运算时按照cube三维立体模式组织的MAC群支持相关运算。

ARM架构

ARM架构，高级精简指令集机器(Advanced RISC Machine，更早称为Acorn精简指令集机器，Acorn RISC Machine)，是一个精简指令集(RISC)处理器架构家族，其广泛地使用在许多嵌入式系统设计。

版本	支持运算	指令集
v3-v7	32位空间和32位算数运算	大部分架构的指令为定长32bit(Thumb指令集支持变长的指令集，提供对32位和16位指令集的支持)
v8-A	添加了对64bit空间和64位算术运算的支持	更新了32位定长指令集