在C/C++代码中使用SSE等指令集的指令(5)SSE进行加法运算简单的性能测试

下面是一个简单的测试SSE指令性能的程序,可以看到明显的性能提升。

(说明:程序中的timing.h使用的是http://blog.csdn.net/gengshenghong/article/details/6973086中介绍的时间间隔获取方法)

 

#define WIN
#include "timing.h"
#include <intrin.h>
#include <stdlib.h>
#include <math.h>

#define N 4*100000		// 注意:必须是4的倍数,否则使用SSE指令计算,要进行一些处理,从而保证正确。
_MM_ALIGN16 float op1[N];
_MM_ALIGN16 float op2[N];
_MM_ALIGN16 float result1[N];
_MM_ALIGN16 float result2[N];

void init()
{
	for(int i = 0;i < N; i++)
	{
		op1[i] = (float)rand()/(float)RAND_MAX;
		op2[i] = (float)rand()/(float)RAND_MAX;
	}
}

void checkResult(int debug)
{
	bool isSame = true;
	for(int i = 0;i < N; i++)
	{
		if (debug)
		{
			printf("%lf		%lf\n", result1[i], result2[i]);
		}
		else
		{
			if (fabs(result1[i] - result2[i]) > 0.000001)
			{
				isSame = false;
				break;
			}
		}
	}
	if (!debug) {
		if (isSame)
			printf("Result is Same\n");
		else
			printf("Result is not same\n");
	}
}

void add1()
{
	for(int i = 0; i < N;i++)
		result1[i] = op1[i] + op2[i];
}

void add2()
{
	__m128  a;
	__m128  b;
	__m128  c;

	for(int i = 0; i < N;i = i + 4)
	{
		// Load
		a = _mm_load_ps(op1 + i);
		b = _mm_load_ps(op2 + i);

		c = _mm_add_ps(a, b);	// c = a + b

		_mm_store_ps(result2 + i, c);
	}
}

int main(int argc, char* argv[])
{
	init();
	srand((unsigned int)time(NULL));

	printf("Add a vector:\n");
	startTiming();
	add1();
	stopWithPrintTiming();

	printf("\n");
	printf("Add a vector with SSE instructions:\n");
	startTiming();
	add2();
	stopWithPrintTiming();

	printf("\n");
	checkResult(0);

	return 0;
}
  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值