华为达芬奇

华为的达芬奇架构基于ARM,为通用处理器添加AI加速功能,如在麒麟810芯片中的应用。达芬奇核心设计理念是提高AI能效,采用3D Cube技术加速矩阵运算,支持不同配置。Ascend 910 AI芯片提供高计算密度,用于大规模分布式训练系统。架构还包括可拓展的计算、内存和互连,以及高效的内存层次结构减少DDR带宽需求。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

达芬奇架构依然是基于ARM架构,是在ARM架构的基础上研发的AI硬件处理单位,它不是ARM处理器, 而是与之配合,为通用处理器添加AI加速器功能。华为的麒麟810芯片采用的是达芬奇NPU,也就是传统的ARM核+AI加速器的模式。当然,这个AI加速器是达芬奇NPU的核心,他把MAC按照不同的计算组成不同的方式,搭配标准的数据缓存,进行AI运算时按照cube三维立体模式组织的MAC群支持相关运算。

ARM架构

ARM架构,高级精简指令集机器(Advanced RISC Machine,更早称为Acorn精简指令集机器,Acorn RISC Machine),是一个精简指令集(RISC)处理器架构家族,其广泛地使用在许多嵌入式系统设计。

版本 支持运算 指令集
v3-v7 32位空间和32位算数运算 大部分架构的指令为定长32bit(Thumb指令集支持变长的指令集,提供对32位和16位指令集的支持)
v8-A 添加了对64bit空间和64位算术运算的支持 更新了32位定长指令集

华为原生全场景

华为原生全场景(all-scenario native)的AI全栈解决方案

<
模块 功能 成品
Ascend(昇腾) 基于统一、可拓展的达芬奇架构的系列化AI IP和芯片 Max,Mini,Lite,Tiny,Nano
CANN
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值