cudaMemcpy2D()和cudaMallocPitch()的使用

#include "head.h"

void gpuInit()
{
	cudaSetDevice(0);
	size_t width = 5;
	size_t height = 5;
	float *h_data, *d_data;
	size_t pitch;

	h_data = (float*)malloc(sizeof(float)*width * height);
	for(int i = 0; i < width * height; ++i)
	{
		h_data[i] = (float)i;
	}
	std::cout << "Allow memory" << std::endl;
	cudaMallocPitch((void**)&d_data,&pitch,sizeof(float)*width, height);
	std::cout << "copy to device" << std::endl;
	cudaMemcpy2D(d_data,pitch,h_data,sizeof(float)*width,sizeof(float)*width,height,cudaMemcpyHostToDevice);

	gpu<<< 1, 1>>>(d_data,height,width,pitch);
	cudaDeviceSynchronize();
	std::cout << "copy to Host" << std::endl;
	cudaMemcpy2D(h_data,sizeof(float)*width,d_data,pitch,sizeof(float)*width,height,cudaMemcpyDeviceToHost);

	for(int i = 0; i < width * height; ++i)
	{
		std::cout << h_data[i] << " ";
		if((i + 1) % width == 0)
		{
			std::cout << std::endl;
		}
	}
	free(h_data);
	cudaFree(d_data);
}
__global__ void gpu(float *devPtr,int height,int width,int pitch)
{
	int row, col;
	float *rowHead;
	for(row = 0;row < height; ++row)
	{
		rowHead = (float*)((char*)devPtr + row * pitch);
		for(col = 0; col < width;++col)
		{
			printf("\t%f",rowHead[col]);
			rowHead[col]++;
		}
		printf("\n");
	}
}

 

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

波雅_汉库克

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值