c语言memcpy拷贝二维数组,对于动态内存分配的二维数组,使用cudaMallocPitch和cudaMemcpy2D进行内存分配与拷贝后,程序运行崩溃...

下面是我的问题代码:

#include "cuda_runtime.h"

#include "device_launch_parameters.h"

#include "device_functions.h"

#include

#include

#define W 25

#define H 25

// 核函数

__global__ void kernel(int* a, size_t pitch)

{

int x = threadIdx.x;

int y = threadIdx.y;

int *row_a = (int*)((char*)a + y * pitch);

// Clear to zero

row_a[x] = 0;

}

int main()

{

int **a;

int *dev_a;

size_t pitch;

dim3 threads(W, H);

// 为a动态分配内存

a = (int**)malloc(H * sizeof(int*));

for (int i = 0; i < H; i++)

{

a[i] = (int*)malloc(W * sizeof(int));

}

// 初始化数组a

for (int i = 0; i < H; i++)

{

for (int j = 0; j < W; j++)

{

a[i][j] = 1;

}

}

printf("修改前的数组内容:\n");

for (int i = 0; i < H; i++)

{

for (int j = 0; j < W; j++)

{

printf("%d ", a[i][j]);

}

printf("\n");

}

// 使用cudaMallocPitch分配设备内存

cudaMallocPitch((void**)&dev_a, &pitch, W * sizeof(int), H);

// 将数组a中的内容拷贝到设备数组dev_a上

cudaMemcpy2D(dev_a, pitch, a, W * sizeof(int), W * sizeof(int), H, cudaMemcpyHostToDevice);

// 调用核函数

kernel<<<1, threads>>>(dev_a, pitch);

// 将结果拷贝回主机

cudaMemcpy2D(a, W * sizeof(int), dev_a, pitch, W * sizeof(int), H, cudaMemcpyDeviceToHost);

printf("修改后的数组内容:\n");

for (int i = 0; i < H; i++)

{

for (int j = 0; j < W; j++)

{

printf("%d ", a[i][j]);

}

printf("\n");

}

return 0;

}

上面代码编译是没有错误的,但是运行时程序会崩溃。当我将动态数组改成静态数组之后,就不会出现这个问题了。希望各位能帮忙解决一下。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值