CUDA之向量点积运算

#include "cuda_runtime.h"
#include "device_launch_parameters.h"
#include <stdio.h>
#include <stdlib.h>
#include <malloc.h>
#define N 10

//向量点积运算
__global__ void Dot(int *a, int *b, int *c)
{
	__shared__ int temp[N];
	temp[threadIdx.x] = a[threadIdx.x] * b[threadIdx.x];
	__syncthreads();
	if (0 == threadIdx.x)
	{
		int sum = 0;
		for (int i; i < N; i++)
		{
			sum += temp[i];
		}
		*c = sum;
		printf("sum Calculated on Device: %d\n", *c);
	}
}

//产生随机整数
void random_ints(int *a, int n)
{
	for (int i = 0; i < n; i++)
	{
		*(a + i) = rand() % 10;
	}
}

int main()
{
	int *a, *b, *c;  //Host变量
	int *d_a, *d_b, *d_c;  //Device变量
	int size = N * sizeof(int);
	//为Device变量在Device中分配内存
	cudaMalloc((void **)&d_a, size);
	cudaMalloc((void **)&d_b, size);
	cudaMalloc((void **)&d_c, sizeof(int));
	//数组初始化
	a = (int *)malloc(size);
	random_ints(a, N);
	b = (int *)malloc(size);
	random_ints(b, N);
	c = (int *)malloc(sizeof(int));
	//打印数组
	printf("Array a[N]:\n");
	for (int i = 0; i < N; i++) printf("%d ", a[i]);
	printf("\n");
	printf("Array b[n]:\n");
	for (int i = 0; i < N; i++) printf("%d ", b[i]);
	printf("\n");

	//将Host数据传入Device中
	cudaMemcpy(d_a, a, size, cudaMemcpyHostToDevice);
	cudaMemcpy(d_b, b, size, cudaMemcpyHostToDevice);
	//在Device中执行Dot函数
	Dot << <1, N >> >(d_a, d_b, d_c);
	//将Device数据传入Host中
	cudaMemcpy(c, d_c, sizeof(int), cudaMemcpyDeviceToHost);

	//在Host上执行向量点积运算
	int sumHost = 0;
	for (int i = 0; i < N; i++)
	{
		sumHost += a[i] * b[i];
	}
	//打印运算结果
	printf("sum Calculated on Host=%d\n", sumHost);
	printf("Device to Host: a*b=%d\n", *c);
	//释放Host变量
	free(a);
	free(b);
	free(c);
	//释放Device变量
	cudaFree(d_a);
	cudaFree(d_b);
	cudaFree(d_c);
	return 0;
}

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

深山里的小白羊

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值