CUDA runtime API 第一次启动时,缓慢的问题

解决CUDA Runtime API 第一次掉用缓慢的问题


前一阵和同事用cuda解决了一些问题,但是在release下,第一次调用CUDA API时,malloc时反应特别缓慢。长达2分钟。于是想着怎么解决这个问题。后来在领导的多方探究下,终于解决了。

1. 在工程-> 属性->Cuda/C++->Device中的Code Generation 中添加如下内容:
compute_20,sm_20
compute_35,sm_35
compute_50,sm_50

2. 在你的主程序的内,初始化CUDA:

cudaSetDevice(0);

cudaFree(0);

这样就可以了。

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
CUDA Runtime API是一种用于基于NVIDIA GPU进行并行计算的应用程序编程接口。它是CUDA平台的一部分,能够让开发人员更加方便地使用GPU进行并行计算任务。 CUDA Runtime API提供了一系列的函数和数据结构,用于管理和控制GPU设备、内存管理、执行并行计算等操作。开发人员可以使用CUDA Runtime API来分配和释放GPU内存、将数据从主机(CPU)内存传输到设备(GPU)内存、定义并行计算的任务以及启动并行计算等操作。此外,CUDA Runtime API还提供了一些辅助函数,用于查询和控制GPU设备的属性。 使用CUDA Runtime API进行并行计算,需要在将计算代码编写为CUDA内核函数,并在主机端(CPU)通过调用相应的函数来启动内核函数在GPU上执行。CUDA Runtime API还支持异步执行操作,可以在主机端发起多个并行计算任务,并使用事件机制进行同步和控制。 CUDA Runtime API相比于底层的CUDA驱动API,更加方便常用的应用程序开发,封装了许多常用的操作,简化了GPU并行计算的编程过程。同,它还提供了一些错误处理和调试工具,帮助开发人员更好地进行CUDA并行计算任务的开发和调试。 总之,CUDA Runtime API提供了一种高级的接口,使得使用GPU进行并行计算的应用程序开发更加简单和高效。它为开发人员提供了丰富的函数库和工具,帮助他们更好地利用GPU的并行计算能力来加速应用程序的执行。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值