Cuda笔记1 --- 内积

/*  CUDA 内积简单例程 */


const int THREAD_DIM = 256;






void __global__  dot(const float* d_a, const float* d_b, float* d_c , const int n) {


	int tid = threadIdx.x + blockIdx.x * blockDim.x;
	int threads = threadIdx.x;
	 __shared__ float cache[THREAD_DIM];


	float temp = 0.0;
	while(tid < n){
		temp += d_a[tid] * d_b[tid];	
		tid += blockDim.x * GridDim.x;
	}


	// 将每一个线程计算的乘积放入相应block中的shared memory里
	cache[threads] = temp;
	__syncthreads();
	//归约求每一个block中内积和 
	int i = blockDim.x / 2;
	while( i != 0){
		if ( threads < i )
		{			
			cache[threads] += cache[threads + i]
		}
		__syncthreads();
		i>>2;
	}
	if (threads == 0) // 选择一个线程取出一个block中的和
	{
		d_c[blockIdx.x] = cache[0];
	}
}


int main(){
	int n = some const;
	dim3 blockPergrid((n +255) / 256, 1);
	dim3 threadPerblock(256,1);
// 将每个block中得和取出在CPU中求和

}


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值