概述
参考文献
-
官方在线文档:https://docs.nvidia.com/cuda/archive/10.1/。
由于网页加载速度比较慢,可以参考如下文档。
-
CUDA_C_Programming_Guide:C编程指南。
-
CUDA_C_Best_Practices_Guide:代码优化指南。
-
CUDA_Runtime_API:CUDA API。
-
CUDA_Driver_API:驱动API。
概念
- Runtime API:可以理解为cuda的顶层API。使用简单,但效率较低。
- Driver API:可以理解为cuda的底层API。使用复杂,但是效率较高。
编译
编译工具
- 在visual studio中,要想编译win32 的cuda10.1程序,必须是visual studio 2013或更低的版本。所以这种情况下使用visual studio 2013。
- 在visual studio 2013创建工程时,分为Nvidia项目和Visual C++项目。如果没有cu文件,创建Visual C++项目即可,但必须有cuda头文件目录\NVIDIA GPU Computing Toolkit\CUDA\v10.1\include,链接必须输入如下目录的库\NVIDIA GPU Computing Toolkit\CUDA\v10.1\lib。
在win32下,visual studio 2013编译为ptx文件时候&#x