C:\ProgramData\NVIDIA Corporation\CUDA Samples\v8.0
0_Simple——简单例程
asyncAPI ——演示了如何使用异步API
cdpSimplePrint——简单演示blocks的运作
cdpSimpleQuicksort——快速排序、基于阈值
clock——测时函数的使用方法
clock_nvrtc——设定时钟/、包括clock_kernel
cppIntegration—— 如何封装CUDA函数,并在C++程序中调用
cppOverload
cudaOpenMP—— CUDA与openMP同时使用的例子
fp16ScalarProduct——向量缩放
inlinePTX
inlinePTX_nvrtc
matrixMul——