【接单外包笔记】各种NVIDIA架构对应的编译参数

本文详细介绍了从Fermi到Hopper架构的GPU显卡,对应的不同CUDA版本和编译参数,帮助用户根据自身显卡选择正确的编译设置。
摘要由CSDN通过智能技术生成

背景

后面需要编译的软件都需要设置gpu的参数,如何正确指导自己的显卡对应的参数值呢?

显卡架构对应图

在这里插入图片描述
我这次编译的是rxt 4070 对应架构为ada,所以在填写参数时为sm_89
在这里插入图片描述

支持列表,如下:

  • Fermi 架构
CUDA 3.2
编译参数:SM20 or SM_20, compute_30
对应卡片:GeForce 400, 500, 600, GT-630 
  • Kepler 架构
CUDA 5 --> 10
编译参数:SM30 or SM_30, compute_30
对应卡片:GeForce 700, GT-730

编译参数:SM35 or SM_35, compute_35
对应卡片:Tesla K40

编译参数:SM37 or SM_37, compute_37
对应卡片:Tesla K80
  • Maxwell 架构
CUDA 6 --> 11
编译参数:SM_50, compute_50
对应卡片:Tesla/Quadro M series

编译参数:SM_52, compute_52
对应卡片:Quadro M6000 , GeForce 900, GTX-970, GTX-980, GTX Titan X

编译参数:SM_53, compute_53
对应卡片:Tegra (Jetson) TX1 / Tegra X1, Drive CX, Drive PX, Jetson Nano
  • Pascal 架构
CUDA 8 以及更高
编译参数:SM_60, compute_60
对应卡片:Quadro GP100, Tesla P100, DGX-1 (Generic Pascal)

编译参数:SM_61, compute_61
对应卡片:GTX 1080, GTX 1070, GTX 1060, GTX 1050, GTX 1030 (GP108), GT 1010 (GP108) Titan Xp, Tesla P40, Tesla P4, Discrete GPU on the NVIDIA Drive PX2

编译参数:SM_62, compute_62
对应卡片:NVIDIA Drive PX2, Tegra (Jetson) TX2
  • Volta 架构
CUDA 9 以及更高
编译参数:SM_70, compute_70
对应卡片:DGX-1 with Volta, Tesla V100, GTX 1180 (GV104), Titan V, Quadro GV100

编译参数:SM_72, compute_72
对应卡片:Jetson AGX Xavier, Drive AGX Pegasus, Xavier NX
  • Turing 架构
CUDA 10 以及更高
编译参数:SM_75, compute_75
对应卡片:GTX/RTX Turing – GTX 1660 Ti, RTX 2060, RTX 2070, RTX 2080, Titan RTX, Quadro RTX 4000, Quadro RTX 5000, Quadro RTX 6000, Quadro RTX 8000, Quadro T1000/T2000, Tesla T4
  • Ampere 架构
CUDA 11.1 以及更高
编译参数:SM_80, compute_80
对应卡片:NVIDIA A100 (the name “Tesla” has been dropped – GA100), NVIDIA DGX-A100

编译参数:SM_86, compute_86
对应卡片:esla GA10x cards, RTX Ampere – RTX 3080, GA102 – RTX 3090, RTX A2000, A3000, RTX A4000, A5000, A6000, NVIDIA A40, GA106 – RTX 3060, GA104 – RTX 3070, GA107 – RTX 3050, RTX A10, RTX A16, RTX A40, A2 Tensor Core GPU

编译参数:SM_87, compute_87(CUDA 11.4)
对应卡片:PTX ISA 7.4 / Driver r470 and newer) – for Jetson AGX Orin and Drive AGX Orin only
  • Ada 架构
CUDA 11.8 以及更高
编译参数:SM_89, compute_89
对应卡片:NVIDIA GeForce RTX 4090, RTX 4080, RTX 6000 Ada, Tesla L40, L40s Ada, L4 Ada
  • Hopper 架构
CUDA 12 以及更高
编译参数:SM90 or SM_90
对应卡片:NVIDIA H100 (GH100), NVIDIA H200

编译参数:SM_90a, compute_90a
对应卡片:Jetson AGX Xavier, Drive AGX Pegasus, Xavier NX
  • Blackwell 架构
CUDA 12 以及更高
编译参数:SM_95, compute_95
对应卡片:NVIDIA B100
  • 7
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值