向device端传递N个一维数组:
1,应该在主机端开辟N个一维数组,然后在device端开辟N个一维数组,并将数据从主机端复制设备端
2.分别在主机端和设备端开辟N个指针数组,主机端指针数组各个指针分别保存设备端各个数组的头指针;
3将主机端指针数组拷贝到设备端指针数组;
这样设备端指针数组各个指针就指向设备端各个数组的头指针了
代码示例
//功能:创建多个一维数组,在device端修改每个元素的值,然后在拷贝到Host端
#include "cuda_runtime.h"
#include "device_launch_parameters.h"
#include "helper_cuda.h"
#include <stdio.h>
#include<iostream>
using namespace std;
#define N 10
__global__ void gpuKernel(int **ptr,int rows)
{
int tid=threadIdx.x;
int bid=blockIdx.x;
if (bid<rows &&tid<bid+1)
{
1,应该在主机端开辟N个一维数组,然后在device端开辟N个一维数组,并将数据从主机端复制设备端
2.分别在主机端和设备端开辟N个指针数组,主机端指针数组各个指针分别保存设备端各个数组的头指针;
3将主机端指针数组拷贝到设备端指针数组;
这样设备端指针数组各个指针就指向设备端各个数组的头指针了
代码示例
//功能:创建多个一维数组,在device端修改每个元素的值,然后在拷贝到Host端
#include "cuda_runtime.h"
#include "device_launch_parameters.h"
#include "helper_cuda.h"
#include <stdio.h>
#include<iostream>
using namespace std;
#define N 10
__global__ void gpuKernel(int **ptr,int rows)
{
int tid=threadIdx.x;
int bid=blockIdx.x;
if (bid<rows &&tid<bid+1)
{