ARM NEON Intrinsics示例

[code=csharp]
#include <stdio.h>
#include <arm_neon.h>

int main() {
float arr[] = { 1, 2, 3, 4, 5, 6, 7, 8, 9, 10 };
int len = sizeof(arr) / sizeof(arr[0]);
int dim_x4 = len / 4;
int left_x4 = len % 4;
float *p = arr; // 创建新的指针p指向数组首元素地址,p与arr独立
float32x4_t sum_vec = vdupq_n_f32(0.0); // 复制创建一个4元素vector sum_vec,并初始化元素为0
for (int dim = 0; dim < dim_x4; dim++) {
p = arr + dim * 4; // 更新指针位置
float32x4_t data_vec = vld1q_f32§; // 从地址p开始load四个元素存至vector data_vec
sum_vec = vaddq_f32(sum_vec, data_vec); // vector相加,结果存入新的vector
}
float32_t sum = vgetq_lane_f32(sum_vec, 0) + vgetq_lane_f32(sum_vec, 1) + vgetq_lane_f32(sum_vec, 2) + vgetq_lane_f32(sum_vec, 3);
p += 4; // 更新指针位置到剩余元素起始地址
for (int left = 0; left < left_x4; left++) {
sum += *(p + left); //对于剩下的少于4个的元素,依次计算累加即可
}
printf(“sum = %f\n”, sum);
return 0;
}
[/code]

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值