生僻的知识点：cuda

最新推荐文章于 2022-08-23 14:37:52 发布

zhengbq_seu

最新推荐文章于 2022-08-23 14:37:52 发布

阅读量392

点赞数

分类专栏： ubuntu 文章标签： CUDA

本文链接：https://blog.csdn.net/zhengbq_seu/article/details/84567727

版权

本文探讨了CUDA的编译选项，特别是-arch和-code参数的作用。-arch用于指定nvcc编译的目标GPU架构，可以是实际GPU型号或虚拟PTX架构。而-code选项则指定最终生成的运行时代码的目标GPU。内容中详细解释了不同虚拟架构compute_XX与实际GPU型号sm_XX的关系，并指出在使用-code时，-arch必须指定为虚拟架构。同时，文章提到了CUDA运行时系统如何处理未找到的可加载二进制代码，并推荐了两篇关于CUDA PTX ISA和硬件架构的阅读资料。

摘要由CSDN通过智能技术生成

CUDA:这些数字究竟啥意思

看程序看到的
include(FindCUDA)
LIST(APPEND CMAKE_MODULE_PATH ${PROJECT_SOURCE_DIR}/cmake_modules)
LIST(APPEND CUDA_NVCC_FLAGS --compiler-options -fno-strict-aliasing -lineinfo -use_fast_math -Xptxas -dlcm=cg)
LIST(APPEND CUDA_NVCC_FLAGS -gencode arch=compute_35,code=sm_35)    #for gtx9XX
LIST(APPEND CUDA_NVCC_FLAGS -gencode arch=compute_50,code=sm_50)    #for maxwell
LIST(APPEND CUDA_NVCC_FLAGS -gencode arch=compute_52,code=sm_52)    #for maxwell
LIST(APPEND CUDA_NVCC_FLAGS -gencode arch=compute_60,code=sm_60)    #for pascal
LIST(APPEND CUDA_NVCC_FLAGS -gencode arch=compute_61,code=sm_61)    #for pascal
LIST(APPEND CUDA_NVCC_FLAGS -gencode arch=compute_62,code=sm_62) #for jetson tx2

-arch: 指定nvcc编译目标GPU的型号，可以为“real” GPU，也可以为“virtual” PTX架构。这个选项指定了nvcc编译到PTX阶段的目标架构，而-code选项指定了nvcc

最低0.47元/天解锁文章

zhengbq_seu

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
生僻的知识点：cuda

CUDA:这些数字究竟啥意思看程序看到的include(FindCUDA)LIST(APPEND CMAKE_MODULE_PATH ${PROJECT_SOURCE_DIR}/cmake_modules)LIST(APPEND CUDA_NVCC_FLAGS --compiler-options -fno-strict-aliasing -lineinfo -use_fast_mat...
复制链接

扫一扫

专栏目录