解决CUDA Runtime API 第一次掉用缓慢的问题
前一阵和同事用cuda解决了一些问题,但是在release下,第一次调用CUDA API时,malloc时反应特别缓慢。长达2分钟。于是想着怎么解决这个问题。后来在领导的多方探究下,终于解决了。
1. 在工程-> 属性->Cuda/C++->Device中的Code Generation 中添加如下内容:
compute_20,sm_20compute_35,sm_35compute_50,sm_50
2. 在你的主程序的内,初始化CUDA:
cudaSetDevice(0);
cudaFree(0);
这样就可以了。