OpenHarmony实战开发-如何使用Neon指令扩展

567 篇文章 8 订阅
555 篇文章 0 订阅

ARM Neon是ARM架构的SIMD(Single Instruction Multiple Data)扩展实现,提供一条指令处理多个数据的并行处理能力,广泛用于多媒体编解码、2D/3D图形处理等领域,提高执行性能。

Neon扩展从ARMv7开始被采用,目前在Cortex-A7、Cortex-A12、Cortex-A15处理器中被设置为默认选项,但在其余的ARMv7 Cortex-A系列中是可选项。具体技术细节请参考《Introducing NEON Development Article》。

ARMv8a架构CPU默认集成Neon扩展,在AArch64与AArch32两种状态下都支持,详细请参考ARM官方文档《Learn the architecture - Introducing Neon》。

OpenHarmony架构支持情况

在OpenHarmony系统中,arm64-v8a ABI下默认已经开启了对Neon扩展的支持;在armeabi-v7a ABI下,为了能够尽可能的支持ARMv7a架构设备,默认不开启Neon扩展。

在OpenHarmony SDK的LLVM工具链中,为armeabi-v7a ABI提供了对多种配置的预编译运行时库的支持,供开发者根据不同的配置进行选择。具体目录结构如下,native-root表示NDK所在的native包解压根目录。

{native-root}/llvm/lib/clang/current/lib/arm-linux-ohos/
    |-- a7_hard_neon-vfpv4
    |       |-- clang_rt.crtbegin.o
    |       |-- clang_rt.crtend.o
    |       |-- ...
    |
    |-- a7_soft
    |       |-- clang_rt.crtbegin.o
    |       |-- clang_rt.crtend.o
    |       |-- ...
    |
    |-- a7_softfp_neon-vfpv4
            |-- clang_rt.crtbegin.o
            |-- clang_rt.crtend.o
            |-- ...

其中hard、soft、softfp是float-abi,未指定默认采用softfp;neon-vfpv4就是-mfpu指定的参数类型,LLVM工具链根据相应编译参数选择依赖不同架构配置的二进制库。

如何使用

使用Neon扩展的主要通过如下几种方式:

  • 使用LLVM的Auto-Vectorization特性,由编译器来生成对应指令,默认开启,可以通过-fno-vectorize关闭,具体参考《Auto-Vectorizationin LLVM》。
  • 使用Neon intrinsics库,方便开发者直接操作低阶Neon指令。
  • 手工写Neon汇编指令。

举例说明

下面举例说明在一个armeabi-v7a OpenHarmony C++工程中如何使用Neon intrinsics。

1.使用Neon intrinsics需要在源码包含arm_neon.h头文件,由于该特性与CPU架构强相关,在包含该头文件时,推荐用cpu features等宏括起来。

#include "cpu_features_macros.h"
void call_neon_intrinsics(short *output, const short* input, const short* kernel, int width, int kernelSize)
{
   int nn, offset = -kernelSize/2;
   for (nn = 0; nn < width; nn++)
   {
        int mm, sum = 0;
        int32x4_t sum_vec = vdupq_n_s32(0); // Neon指令函数
        for(mm = 0; mm < kernelSize/4; mm++)
        {
            int16x4_t  kernel_vec = vld1_s16(kernel + mm*4);
            int16x4_t  input_vec = vld1_s16(input + (nn+offset+mm*4));
            sum_vec = vmlal_s16(sum_vec, kernel_vec, input_vec);
        }
        ...
   }
   ...
}

2.在函数实现处,根据CPU特性调用对应的实现函数。

void Compute(void) {
#if defined (CPU_FEATURES_ARCH_ARM)
  static const ArmFeatures features = GetArmInfo().features;
  // 根据features的字段进行支持cpu features的特性判断
  if (features.neon) {
    // Run optimized code.
  } else {
    // call normal function writed in c
  }
#endif
}

3.在CMakeLists.txt文件中添加对应选项。

if (${OHOS_ARCH} STREQUAL "armeabi-v7a")
    set(CMAKE_CXX_FLAGS "${CMAKE_CXX_FLAGS} -mfpu=neon -mfloat-abi=softfp")
endif ()

上述步骤完成后,开发者即可在工程中使用Neon intrinsics指令。

我这边特意整理了《鸿蒙语法ArkTS、TypeScript、ArkUI、实战开发视频教程》以及《鸿蒙生态应用开发白皮书V2.0PDF》《鸿蒙开发学习手册》(共计890页)鸿蒙开发资料等…希望对大家有所帮助:https://docs.qq.com/doc/DZVVBYlhuRkZQZlB3

鸿蒙语法ArkTS、TypeScript、ArkUI等…视频教程:https://docs.qq.com/doc/DZVVBYlhuRkZQZlB3

在这里插入图片描述

OpenHarmony APP开发教程步骤:https://docs.qq.com/doc/DZVVBYlhuRkZQZlB3

在这里插入图片描述

鸿蒙生态应用开发白皮书V2.0PDF:https://docs.qq.com/doc/DZVVkRGRUd3pHSnFG

在这里插入图片描述

应用开发中级就业技术:https://docs.qq.com/doc/DZVVBYlhuRkZQZlB3

在这里插入图片描述

应用开发中高级就业技术:https://docs.qq.com/doc/DZVVBYlhuRkZQZlB3

在这里插入图片描述

南北双向高工技能基础:https://docs.qq.com/doc/DZVVBYlhuRkZQZlB3

在这里插入图片描述

全网首发-工业级 南向设备开发就业技术:https://docs.qq.com/doc/DZVVBYlhuRkZQZlB3

在这里插入图片描述

《鸿蒙开发学习手册》:

如何快速入门:https://docs.qq.com/doc/DZVVBYlhuRkZQZlB3

1.基本概念
2.构建第一个ArkTS应用
3.……

在这里插入图片描述

开发基础知识:https://docs.qq.com/doc/DZVVBYlhuRkZQZlB3

1.应用基础知识
2.配置文件
3.应用数据管理
4.应用安全管理
5.应用隐私保护
6.三方应用调用管控机制
7.资源分类与访问
8.学习ArkTS语言
9.……

在这里插入图片描述

基于ArkTS 开发:https://docs.qq.com/doc/DZVVBYlhuRkZQZlB3

1.Ability开发
2.UI开发
3.公共事件与通知
4.窗口管理
5.媒体
6.安全
7.网络与链接
8.电话服务
9.数据管理
10.后台任务(Background Task)管理
11.设备管理
12.设备使用信息统计
13.DFX
14.国际化开发
15.折叠屏系列
16.……

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值