源于CUDA的异构并行计算
- GPU必须通过PCIe总线与基于CPU的主机相连,GPU称作设备端,CPU称作主机端
- 异构的代码包括:设备代码+主机代码
- 评估GPU性能:峰值计算性能(GFlops/TFlops/PFlops) + 内存带宽
- 为了支持使用CPU+GPU异构系统架构来执行应用程序,NVIDIA设计CUDA的编程模型
- CUDA运行时API基于驱动API封装,更容易使用,两种API相互排斥,只能使用其中一个
- 主机代码是C代码,设备代码是CUDA C代码,在链接阶段,内核程序调用时和显示GPU设备操作中添加CUDA运行时库,通过nvcc进行编译