一步步做程序优化【2】OpenACC指令

通过添加OpenACC指令,可以显著提高程序运行效率。在原有测试程序不变的情况下,只需简单修改并使用HMPP编译器,即可在支持CUDA的GPU上加速计算。通过调整代码,进一步减少了数据传输,使得矩阵运算更加高效。读者可以复制代码并进行测试以体验加速效果。
摘要由CSDN通过智能技术生成

这个写了很长时间了,但是一直没有顾上额。把这个版本稍微修改一下,只需要加上一个指令,我们就可以得到不错的效率奥。

看代码吧:

// C = alpha*A*B + beta*C
void mySgemm(int m, int n, int k, float alpha, float beta,\
			 float *A,  float *B, float *C)
{
	int i, j, l;
	float ab;
#pragma acc kernels copy(A[0:m*n],B[0:m*n],C[0:m*n])
#pragma acc loop independent
	for(j = 0; j < m; j++) 
	{
#pragma acc loop independent
		for(i = 0 ;i < k ;i++)
		{
			ab = 0.0f;
			for(l = 0 ;l < n ;l++)
			{
				ab += A[j*n+l] * B[l*k+i];
			}
			C[j*k+i] = alpha*ab + beta*C[j*k+i];
		}
	}
}


这样,我们只是加入了几个指导语句,剩下的事是编译器帮我们做的奥,你原先的测试程序并不需要任何改变奥。

我之前讲过HMPP编译器的安装和使用,http://blog.csdn.net/bendanban/article/details/7662583大家可以使用HMPP编译器编译这段代码,在Linux下(安装好C

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值