NEON 技术汇总

像来自天空

已于 2023-04-04 16:13:20 修改

阅读量113

点赞数

文章标签：嵌入式硬件

于 2023-04-03 09:33:20 首次发布

本文链接：https://blog.csdn.net/m0_37147439/article/details/129922142

版权

NEON 数据类型和指令类型
1、NEON 数据类型
NEON 向量数据类型是根据以下模式命名的：x<number_of_lanes>_t，eg：int8x16_t 是一个16 通道的向量，每个通道包含一个有符号 8 位整数
NEON 还提供了数组向量数据类型，命名模式如下：xx_t，eg：int8x16x4_t 是一个长度为 4 的数组，每一个数据的类型为 int8x16_t

2、NEON 指令类型
NEON指令的函数名组成格式：v_ ，逐元素进行操作
v：vector 的缩写，表示向量
mod：
q：表示饱和计算，int8x8_t vqadd_s8(int8x8_t a, int8x8_t b); // a 加 b 的结果做饱和计算
h：表示折半计算，int8x8_t vhsub_s8(int8x8_t a, int8x8_t b); // a 减 b 的结果右移一位
d：表示加倍计算，int32x4_t vqdmull_s16(int16x4_t a, int16x4_t b); // a 乘 b 的结果扩大一倍, 最后做饱和操作
r：表示舍入计算，int8x8_t vrhadd_s8(int8x8_t a, int8x8_t b); // 将 a 与 b 的和减半,同时做 rounding 操作, 每个通道可以表达为: (ai + bi + 1) >> 1
p：表示 pairwise 计算，int8x8_t vpadd_s8(int8x8_t a, int8x8_t b); // 将 a, b 向量的相邻数据进行两两和操作
opname：表示具体操作，比如 add，sub 等
shape：
l：表示 long，输出向量的元素长度是输入长度的 2 倍，uint16x8_t vaddl_u8(uint8x8_t a, uint8x8_t b);
w：表示 wide，第一个输入向量和输出向量类型一样，且是第二个输入向量元素长度的 2 倍，uint16x8_t vsubw_u8(uint16x8_t a, uint8x8_t b);
n：表示 narrow，输出向量的元素长度是输入长度的 1/2 倍，uint32x2_t vmovn_u64(uint64x2_t a);
_high：AArch64专用，而且和 l/n 配合使用，当使用 l(Long) 时，表示输入向量只有高 64bit 有效；当使用 n(Narrow) 时，表示输出只有高 64bit 有效，int16x8_t vsubl_high_s8(int8x16_t a, int8x16_t b); // a 和 b 只有高 64bit 参与运算
_n：表示有标量参与向量计算，int8x8_t vshr_n_s8(int8x8_t a, const int n); // 向量 a 中的每个元素右移 n 位
_lane：指定向量中某个通道参与向量计算，int16x4_t vmul_lane_s16(int16x4_t a, int16x4_t v, const int lane); // 取向量 v 中下标为 lane 的元素与向量 a 做乘法计算
flags：q 表示 quad word，四字，指定函数对 128 位 Q 寄存器进行操作，不带 q 则对 64 位 D 寄存器进行操作
type：表示函数的参数类型（u8/16/32/64、s8/16/32/64、f16/32 等）