本文详细解释了昇腾达芬奇架构中计算单元的架构与计算原理。
1、达芬奇架构概览
达芬奇架构是一种 “ 特定域架构 ” (Domin Specific Architecture,DSA) 芯片。
昇腾AI处理器的计算核心主要由 AI Core 构成,包含三种基础计算资源:矩阵计算单元(Cube Unit
)、向量计算单元(Vector Unit
)和标量计算单元(Scalar Unit
),负责执行张量、矢量、标量计算。AI Core 中的矩阵计算单元支持 Int8 和 fp16 的计算,向量计算单元支持 fp16 和 fp32 的计算。AI Core 基本结构如下:
这里主要讲解 AI Core 中的计算单元,也就是上图中的黄色部分(矩阵计算单元、向量计算单元、标量计算单元及累加器模块),其他模块在这里就不展开说了。