cuda矩阵编程(一)

本文展示了如何使用CUDA的一维线程和一维数组存储来实现矩阵乘法。通过定义`Mulitkernel`内核函数,利用GPU的并行计算能力进行高效计算。`matgen`函数用于生成随机矩阵。代码中使用了`cudaMalloc`和`cudaMemcpy`进行设备内存分配和数据传输。
摘要由CSDN通过智能技术生成

资料杂乱无章,各种思维的编程(历经心酸有以下体会)

废话不多说,先贴上最简洁的代码
#include "cuda_runtime.h"
#include "device_launch_parameters.h"

#include <stdio.h>
#include<stdlib.h>
#define threadsperblock 128
#define Matrix_size 256
__global__ static void Mulitkernel(const float* a, const float* b, float* c,int n)
{
	int tid = threadIdx.x;
	int bid = blockIdx.x;
	int idx = bid*threadsperblock + tid;
	int row = idx / n;
	int col = idx%n;
	float Cvalue = 0;
	for (int i = 0; i < n; i++)
	{
		Cvalue += a[row*n + i] * b[i*n + col];
	}
	c[row*n + col] = Cvalue;
}

void matgen(float* a, int n)
{
	int i, j;
	for (i = 0; i < n; i++)
		for (j = 0; j <n; j++)
			a[i*n + j] = (float)rand() / RAND_MAX + (float)rand() / (RAND_MAX*RAND_MAX);
}

int main()
{
	float *a, *b, *c, *d;
	int n = Matrix_size;
	a = (float*)malloc(

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值