命令:nvidia-smi -l
可以看到GPU的型号,例如:
这台机器的GPU版本就是P4。
我们的CMakeLists.txt中是这么写的:
LIST(APPEND CUDA_NVCC_FLAGS --default-stream per-thread;-O3;-arch=sm_52;-lineinfo; --use_fast_math; -DUSE_OPENAI_GEMM)
当迁移代码到另外一台机器,GPU型号却是如下:
这时候要注意修改CMakeLists.txt为:
LIST(APPEND CUDA_NVCC_FLAGS -std=c++11 --default-stream per-thread;-O3;-arch=sm_35;-lineinfo; --use_fast_math)
否则,你代码不会报错,但是运行时会出莫名其妙的结果,不合预期。