二维vector传递到CUDA中实现并行计算

最新推荐文章于 2024-04-27 16:49:54 发布

VIP文章孤独的学习

最新推荐文章于 2024-04-27 16:49:54 发布

阅读量1.2k

点赞数

分类专栏： CUDA 文章标签： c++

本文链接：https://blog.csdn.net/weixin_42261213/article/details/104047376

版权

std::vector<std::vector>传递到CUDA中实现并行计算

一、vector内存分配

我们知道std::vector内存分配时连续的，但是对于二维数组或多维数组来说，内部vector不占用外部vector的空间，所以二维数组或多维数组内部每一行的内存都是连续的，外部vector存储内部vector的相关信息，也是连续的。详细内容可参考这篇博客：https://blog.csdn.net/abc_xian/article/details/100164594

二、CUDA存储

在CUDA中存储方式为线性存储，一般使用cudaMalloc()、cudaMemcpy等函数申请拷贝内存，还有二维以及三维内存申请。

三、示例

#include<cuda_runtime.h>
#include<vector>
#include<stdio.h>
#include<stdlib.h>

#define VOXEL_COLS (3)

__global__ void init(double **A, double *A_data, int n, int m)
{
       
	int tid = blockDim.x * blockIdx.x + threadIdx.x;    
	if (tid<n)
	{
          
		A[tid] = &A_data[tid*m];
	}
}

__global__ void findNearVoxel(double ** strVector, double pitch)
{
   
	//int y = blockIdx.x*blockDim.x + threadIdx.x;    
	//int x = blockIdx.y*blockDim.y

最低0.47元/天解锁文章

孤独的学习

关注

0
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
二维vector传递到CUDA中实现并行计算

std::vector<std::vector>传递到CUDA中实现并行计算一、vector内存分配我们知道std::vector内存分配时连续的，但是对于二维数组或多维数组来说，内部vector不占用外部vector的空间，所以二维数组或多维数组内部每一行的内存都是连续的，外部vector存储内部vector的相关信息，也是连续的。详细内容可参考这篇博客：https://blog...
复制链接

扫一扫