CUDA学习—cudaMallocArray()

名称:
cudaMemcpyToArray – 在主机和设备间复制数据

概要:
cudaError_t cudaMemcpyToArray(struct cudaArray* dstArray,size_t dstX,size_t dstY,const void* src,size_t count,enum cudaMemcpyKind kind)
cudaError_t cudaMemcpyToArrayAsync(struct cudaArray* dstArray,size_t dstX,size_t dstY,const void* src,size_t count,enum cudaMemcpyKind kind,cudaStream_t stream)

说明
从src指向的存储器区域内将count个字节复制到一个CUDA数组dstArray,该数组的左上角从(dstX,dstY)开始,其中kind是cudaMemcpyHostToHost、cudaMemcpyHost-ToDevice、cudaMemcpyDeviceToHost或cudaMemcpyDeviceToDevice之一,用于指定复制的方向。
cudaMemcpyToArrayAsync()是异步的,可选择传入非零流参数,从而将其关联到一个流。它仅对分页锁定的主存储器有效,如果传入指向可分页存储器的指针,那么将返回一个错误。

返回值
相关返回值:
cudaSuccess
cudaErrorInvalidValue
cudaErrorInvalidDevicePointer cudaErrorInvalidMemcpyDirection
注意,如果之前是异步启动,该函数可能返回错误码。

注:
在《CUDA编程指导》中对,cudaMallocArray()函数的使用,个人觉得有错误。
enum cudaMemcpyKind kind ,应该是cudaMemcpyHostToHost、cudaMemcpyHost-ToDevice、cudaMemcpyDeviceToHost或cudaMemcpyDeviceToDevice之一。
在指导中使用的是cudaMemcpyToArray(cuArray,0,0,h_data,&channelDesc),channelDese为cudaChannelFormatDesc类型,不是cudaMemcpyKind.

/*********************************************************************/
/*  This is a example of the CUDA program.*/
/*********************************************************************/
#include <stdio.h>
#include <stdlib.h>
#include <cuda_runtime.h>
#include <cutil.h>

/************************************************************************/
/* myKernel                                                           */
/************************************************************************/

/************************************************************************/
/* Main CUDA                                                            */
/************************************************************************/
int main(int argc, char* argv[])
{
    const int width=10;
    const int height=10;

   //初始化h_array 
   int h_array[width][height];
    for (int i=0;i<width;i++)
        for (int j=0;j<height;++j)
            h_array[i][j]=j+i*64;
        }
    }

    //以机构提channelDesc描述CUDA数组中的组件数量和数据类型
    cudaChannelFormatDesc channelDesc = cudaCreateChannelDesc(32,0,0,0,cudaChannelFormatKindUnsigned);
    cudaArray* cuArray;
    cudaMallocArray(&cuArray,&channelDesc,width,height);
    
    size_t sizeMem=width*height*sizeof(int);
    size_t potX=0;
    size_t potY=0;
    cudaMemcpyToArray(cuArray,potX,potY,h_array,sizeMem,cudaMemcpyDeviceToHost);

    cudaFreeArray(cuArray);

    return 0;
}

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
对于学习 CUDA C 的指南,我推荐以下步骤: 1. 学习 CUDA 基础知识:首先,你需要了解 CUDA 平台的基本概念和架构。学习 CUDA 编程前,建议先熟悉 GPU 的工作原理、并行计算等基本概念。 2. 学习 C/C++ 语言:CUDA C 是在 C/C++ 语言的基础上进行扩展的,因此你需要熟悉 C/C++ 的语法和基本的编程概念。如果你已经熟悉 C/C++,可以跳过这一步。 3. 安装 CUDA 工具包:在开始编写 CUDA C 代码之前,你需要安装 CUDA 工具包。CUDA 工具包包含了编译器、调试器和其他必要的工具。 4. 学习 CUDA 编程模型:CUDA 提供了一种并行计算模型,其中核心概念是将任务分配给多个线程执行。了解 CUDA 编程模型将帮助你正确地编写并行化的代码。 5. 编写第一个 CUDA 程序:通过编写一个简单的 CUDA 程序来加深对 CUDA 编程的理解。你可以从一些基本的向量加法或矩阵乘法开始。 6. 学习 CUDA 的内存模型:CUDA 提供了多种内存类型,包括全局内存、共享内存和常量内存等。了解这些内存类型的特性和使用方法对于优化 CUDA 程序至关重要。 7. 优化 CUDA 程序:学习如何通过合理的算法选择、内存访问模式优化和使用 CUDA 提供的优化技术来提高 CUDA 程序的性能。 8. 深入研究 CUDA 相关主题:学习 CUDA 的高级主题,如动态并行、异步执行、CUDA 模板库(Thrust)等,以及与其他库(如 cuDNN、cuBLAS)的集成。 在学习过程中,可以参考 NVIDIA 官方文档和教程,例如 CUDA C Programming Guide,以及一些优秀的 CUDA 编程书籍和在线资源。同时,尝试编写一些简单的 CUDA 应用程序并实践,通过实践来巩固所学知识。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值