cuda,day-9,矩阵乘法

#include <stdio.h>
#include "cuda_runtime.h"
#include "device_launch_parameters.h"
#include <iostream>
#include <stdlib.h>
#include <conio.h>
using namespace std;
#define u32 unsigned int 
#define ARRAY_SIZE_X 2
#define ARRAY_SIZE_Y 3
u32 cpu_mat_input1[ARRAY_SIZE_X][ARRAY_SIZE_Y];
u32 cpu_mat_input2[ARRAY_SIZE_Y][ARRAY_SIZE_X];
u32 cpu_mat_result[ARRAY_SIZE_X][ARRAY_SIZE_X];
__global__ void func2(
	u32 * gpu_mat_input1,
	u32 * gpu_mat_input2,
	u32 * gpu_mat_result,
	u32 Width,
	u32 Width1,
	u32 Width2);
u32 main(void)
{
	for (u32 y = 0; y < ARRAY_SIZE_Y; y++)
	{
		for (u32 x = 0; x < ARRAY_SIZE_X; x++)
		{
			cpu_mat_input1[x][y] = rand() % 8;
			cpu_mat_input2[y][x] = rand() % 8;
		}
	}
	dim3 threads_rect(ARRAY_SIZE_X, ARRAY_SIZE_X);
	dim3 blocks_rect = 1;
	u32 * gpu_mat_input1;
	u32 * gpu_mat_input2;
	u32 * gpu_mat_result;
	cudaMalloc((void **)& gpu_mat_input1, (ARRAY_SIZE_X)*(ARRAY_SIZE_Y)*(sizeof(u32)));
	cudaMalloc((void **)& gpu_mat_input2, (ARRAY_SIZE_Y)*(ARRAY_SIZE_X)*(sizeof(u32)));
	cudaMalloc((void **)& gpu_mat_result, (ARRAY_SIZE_X)*(ARRAY_SIZE_X)*(sizeof(u32)));
	cudaMemcpy(gpu_mat_input1, cpu_mat_input1, (ARRAY_SIZE_X)*(ARRAY_SIZE_Y)*(sizeof(u32)), cudaMemcpyHostToDevice);
	cudaMemcpy(gpu_mat_input2, cpu_mat_input2, (ARRAY_SIZE_Y)*(ARRAY_SIZE_X)*(sizeof(u32)), cudaMemcpyHostToDevice);
	func2 << <blocks_rect, threads_rect >> >(
		gpu_mat_input1,
		gpu_mat_input2,
		gpu_mat_result,
		ARRAY_SIZE_X,
		ARRAY_SIZE_Y,
		ARRAY_SIZE_X);
	cudaMemcpy(cpu_mat_result, gpu_mat_result, (ARRAY_SIZE_X)*(ARRAY_SIZE_X)*(sizeof(u32)), cudaMemcpyDeviceToHost);
	cudaFree(gpu_mat_input1);
	cudaFree(gpu_mat_input2);
	cudaFree(gpu_mat_result);
	cout << "input1:" << endl;
	for (u32 x = 0; x < ARRAY_SIZE_X; x++)
	{
		for (u32 y = 0; y < ARRAY_SIZE_Y; y++)
		{
			cout << cpu_mat_input1[x][y] << " ";
		}
		cout << endl;
	}
	cout << "input2:" << endl;
	for (u32 y = 0; y < ARRAY_SIZE_Y; y++)
	{
		for (u32 x = 0; x < ARRAY_SIZE_X; x++)
		{
			cout << cpu_mat_input2[y][x] << " ";
		}
		cout << endl;
	}
	cout << "result:" << endl;
	for (u32 x = 0; x < ARRAY_SIZE_X; x++)
	{
		for (u32 y = 0; y < ARRAY_SIZE_X; y++)
		{
			cout << cpu_mat_result[x][y] << " ";
		}
		cout << endl;
	}
	printf("press any key to continue\n");
	cin.get();
	return 0;
}
__global__ void func2(
	u32 * gpu_mat_input1,
	u32 * gpu_mat_input2,
	u32 * gpu_mat_result,
	u32 Width,
	u32 Width1,
	u32 Width2)
{
	u32 idx = threadIdx.x;
	u32 idy = threadIdx.y;
	u32 Pvalue = 0;
	for (int k = 0; k < Width1; ++k)
	{
		u32 a = gpu_mat_input1[idy*Width1 + k];
		u32 b = gpu_mat_input2[k*Width2 + idx];
		Pvalue = Pvalue + a*b;
		//printf("idy:%d,idx:%d,k:%d,a:%d,b:%d,Pvalue:%d\n",idy,idx,k,a,b,Pvalue);
	}
	gpu_mat_result[idy*Width + idx] = Pvalue;
}

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

RtZero

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值