ARM
® NEON™ 通用
SIMD 引擎可有效处理当前和将来的多媒体格式,从而改善用户体验。
NEON 技术可加速多媒体和信号处理算法(如视频编码/解码、2D/3D 图形、游戏、音频和语音处理、图像处理技术、电话和声音合成),其性能至少为 ARMv5 性能的 3 倍,为ARMv6 SIMD 性能的 2 倍。
通过干净方式构建的 NEON 技术可无缝用于其本身的独立管道和寄存器文件。
NEON 技术是 ARM Cortex™-A 系列处理器的 128 位 SIMD(单指令,多数据)架构扩展,旨在为消费性多媒体应用程序提供灵活、强大的加速功能,从而显著改善用户体验。它具有 32 个寄存器,64 位宽(双倍视图为 16 个寄存器,128 位宽。)
NEON 指令可执行“打包的 SIMD”处理:
- 寄存器被视为同一数据类型的元素的矢量
- 数据类型可为:签名/未签名的 8 位、16 位、32 位、64 位单精度浮点
- 指令在所有通道中执行同一操作
使用 NEON 技术的 ARM Cortex™-A 系列处理器,以及 ARM 的 Mali 多媒体硬件解决方案可用于多媒体应用,范围从智能手机和移动计算设备到HDTV。
NEON 增强了用户体验
NEON 可增强许多多媒体用户体验:
- 观看任意格式的任意视频
- 编辑和强化捕获的视频 – 视频稳定性
- 锯齿消除渲染和合成
- 游戏处理
- 快速处理几百万像素的照片
- 语音识别
- 强大的多通道高保真音频处理
NEON 的特征和优点
NEON 支持用于 Internet 应用程序的范围广泛的多媒体编解码器:
所需周期减少:
- NEON 可使复杂视频编解码器的性能提升 60-150%
- 单个简单 DSP 算法可实现更大的性能提升(4 倍 -8 倍)
- 处理器可更快进入睡眠状态,从而在整体上节约了动态功耗
NEON 技术的大量元素能够提高性能并简化软件开发过程,如:
- 通过对齐和非对齐数据访问,可对 SIMD 操作进行有效的矢量化。
- 清晰的指令集架构,设计用于自动矢量化编译器和手动编码。
- 有效访问打包数组,如 ARGB 或 xyz 坐标
- 支持整数和浮点操作,以确保适合从编解码器、高性能计算到 3D 图形等广泛应用领域。
- 与 ARM 处理器紧密结合,提供单指令流和内存的统一视图,从而能够提供一个具有更简单工具流的开发平台目标。nbsp;
- 通过具有双 128 位/64 位视图的大型 NEON 寄存器文件,可有效处理数据并尽可能减少对内存的访问,从而增加了数据吞吐量。
SIMD
以同步方式,在同一时间内执行同一条指令。
SIMD在性能上的优势:
以加法指令为例,单指令单数据(
SISD)的CPU对加法指令译码后,执行部件先访问内存,取得第一个
操作数;之后再一次访问内存,取得第二个操作数;随后才能进行求和运算。而在SIMD型的CPU中,指令译码后几个执行部件同时访问内存,一次性获得所有
操作数进行运算。这个特点使SIMD特别适合于多媒体应用等数据密集型运算。
如:
AMD公司引以为豪的3D NOW! 技术实质就是SIMD,这使K6-2、雷鸟、毒龙处理器在音频解码、视频回放、3D游戏等应用中显示出优异的性能。
http://www.arm.com/zh/products/processors/technologies/neon.php