文章目录
ARM X 系列和 Z 系列 NPU 详解
ARM 的 NPU(Neural Processing Unit)系列产品主要分为 X 系列和 Z 系列,这些 NPU 旨在加速人工智能(AI)和机器学习(ML)任务。它们被广泛应用于各种设备,从高端智能手机到物联网(IoT)设备。以下是对 ARM X 系列和 Z 系列 NPU 的详细介绍,包括各型号、算力和应用场景。
ARM X 系列 NPU
ARM X 系列 NPU 主要面向高端市场,提供高性能的 AI 加速能力,适用于需要复杂计算的设备,如高端智能手机和平板电脑。
ARM X 系列 NPU型号和算力
以下是一些常见的 ARM X 系列 NPU 型号及其算力:
-
Ethos-N78:
- 算力:可扩展至 10 TOPS(Tera Operations Per Second)
- 工艺:7nm
- 特性:支持高吞吐量和低延迟,适用于高性能 AI 任务
-
Ethos-N77:
- 算力:最高 4 TOPS
- 工艺:10nm
- 特性:具有约 5TOPS / W的较高功率效率。N77专为高级和中端 AR/VR 设备而设计,尽管它具有性能增强功能,但您仍需要更强大的功能。为了获得更高的性能,需要更高的内存带宽(内存带宽需要高达 8GB / s甚至更高)。
-
Ethos-N53:
- 算力:最高 2 TOPS
- 工艺:16nm
- 特性:适用于中高端设备,具有较高的能效比
ARM X 系列 NPU 应用场景
- 图像识别:实时图像分类、物体检测等任务
- 自然语言处理:语音识别、文本生成等任务
- 增强现实(AR)和虚拟现实(VR):高实时性和高精度的环境感知和互动
- 视频处理:视频编码、解码和增强
ARM Z 系列 NPU 简介
ARM Z 系列 NPU 面向中低端市场,提供高能效比的 AI 加速能力,适用于智能家居设备、物联网设备等。
ARM Z 系列 NPU 型号和算力
以下是一些常见的 ARM Z 系列 NPU 型号及其算力:
- Ethos-U85:
- 单周期支持从 128 到 2048 个 MAC单元的配置——在 1GHz 时,算力可支持从 256 GOPS 到 4 TOPS;
- 支持 int8 权重和 int8 或 int16 激活;
- 支持 Transformer 架构网络,以及 CNN 和 RNN;
- 硬件原生支持 2/4 稀疏性,使吞吐量翻倍;
- 内部 SRAM 为 29 至 267 KB,多达六个 128 位 AXI5 接口;
- 支持权重压缩,采用标准和快速权重编码器;
- 支持扩展压缩。
- Ethos-U65:
- 算力:最高 1 TOPS
- 工艺:22nm
- 特性:适用于低功耗边缘设备,高能效比
- Ethos-U55:
- 算力:最高 0.5 TOPS
- 工艺:28nm
- 特性:专为微控制器设计,适用于超低功耗应用
ARM Z 系列 NPU 应用场景
- 智能家居:智能摄像头、智能门铃、家居自动化设备等
- 物联网:传感器数据处理、边缘计算等任务
- 医疗设备:便携式医疗设备的数据分析和处理
- 工业监控:设备状态监控、故障预测等
Summary
ARM 的 X 系列和 Z 系列 NPU 分别面向不同的市场需求,提供了高性能和高能效比的 AI 加速解决方案。X 系列适用于高端设备和复杂的 AI 任务,而 Z 系列则适用于中低端设备和能效优化的应用场景。通过具体的型号和应用场景,可以看到 ARM NPU 在各类设备和任务中的广泛应用。