Neno和OpenMP的性能提升验证

1、环境配置:
(1)NDK的环境;
(2)ARM的CPU;

normal neon openMP
56 64 37(存在波动)

测试实例1:normal,正常的测试一个求float类型的平方的一个例子;具体 如下
void computeMap(float* in, float* out, int LEN){
TRACE_B();
for(int i=0 ;i<LEN;i++)
{
out[i]=in[i]in[i];
}
}
测试实例 2:neno方式的应用,通过对一个128位字节,一次计算4个float类型的平方的计算来加快计算;具体如下;
void computeNeno(float
in, float* out, int LEN){
TRACE_B();
int end=LEN-LEN%4;
for(int i=0;i<end;i=i+4){
float32x4_t a = vld1q_f32(in+i);
a=vmulq_f32(a,a);
vst1q_f32(out+i,a);
}
for(int j=end;j<LEN;j++){
out[j]=in[j]<

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值