如何查看CUDA算力/内存总量/架构信息等

终端进到装CUDA的目录C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v11.6\extras\demo_suite

然后输入deviceQuery

如果报错👇,就加个./deviceQuery

结果如下所示:

这段信息是与 NVIDIA GeForce RTX 4090 显卡相关的设备信息。下面对每一行进行解释:

  • Device 0: "NVIDIA GeForce RTX 4090": 表示设备索引为0,型号为"NVIDIA GeForce RTX 4090"的显卡。

  • CUDA Driver Version / Runtime Version: CUDA驱动程序版本和运行时版本分别为12.0和11.6。

  • CUDA Capability Major/Minor version number: 显卡的CUDA计算能力主/次版本号为8.9。

  • Total amount of global memory: 显存总量为24564 MBytes(25756696576字节)。

  • MapSMtoCores for SM 8.9 is undefined. Default to use 128 Cores/SM: 对于8.9版本的SM(Streaming Multiprocessor),128个CUDA核心/SM是默认值。

  • (128) Multiprocessors, (128) CUDA Cores/MP: 总共有128个多处理器(Multiprocessors),每个多处理器有128个CUDA核心。

  • GPU Max Clock rate: 显卡的最大时钟频率为2535 MHz(2.54 GHz)。

  • Memory Clock rate: 显存的时钟频率为10501 Mhz。

  • Memory Bus Width: 显存总线宽度为384位。

  • L2 Cache Size: L2缓存大小为75497472字节。

  • Maximum Texture Dimension Size (x,y,z): 最大纹理维度大小为1D=(131072),2D=(131072, 65536),3D=(16384, 16384, 16384)。

  • Maximum Layered 1D/2D Texture Size: 最大分层纹理大小为1D=(32768),2048层;2D=(32768, 32768),2048层。

  • Total amount of constant memory: 常量内存总量(zu为占位符)。

  • Total amount of shared memory per block: 每个线程块的共享内存总量(zu为占位符)。

  • Total number of registers available per block: 每个线程块可用的寄存器数为65536个。

  • Warp size: 线程束(warp)大小为32个线程。

  • Maximum number of threads per multiprocessor/block: 每个多处理器/线程块中的最大线程数分别为1536和1024个。

  • Max dimension size of a thread block/grid size: 线程块/网格的最大维度大小分别为(x,y,z)=(1024, 1024, 64)和(x,y,z)=(2147483647, 65535, 65535)。

  • Maximum memory pitch: 最大内存跨度(pitch)大小(zu为占位符)。

  • Texture alignment: 纹理内存对齐要求(zu为占位符)。

  • Concurrent copy and kernel execution: 是否支持并发的数据拷贝和核函数执行,这里是支持的。

  • Run time limit on kernels: 核函数的运行时间限制,这里是支持的。

  • Integrated GPU sharing Host Memory: 是否与主机内存共享,这里是不支持的。

  • Support host page-locked memory mapping: 是否支持主机页锁定内存映射,这里是支持的。

  • Alignment requirement for Surfaces: 表面(Surface)内存对齐要求,这里是支持的。

  • Device has ECC support: 设备是否支持ECC(Error Correcting Code)校验,这里是禁用的。

  • CUDA Device Driver Mode (TCC or WDDM): CUDA设备驱动程序模式,这里是WDDM(Windows显示驱动模型)。

  • Device supports Unified Addressing (UVA): 设备是否支持统一寻址(Unified Addressing),这里是支持的。

  • Device supports Compute Preemption: 设备是否支持计算抢占,这里是支持的。

  • Supports Cooperative Kernel Launch: 是否支持协作式核函数启动,这里是支持的。

  • Supports MultiDevice Co-op Kernel Launch: 是否支持多设备的协作式核函数启动,这里是不支持的。

  • Device PCI Domain ID / Bus ID / location ID: 设备的PCI域ID、总线ID和位置ID。

  • Compute Mode: 计算模式,默认是多个主机线程可同时使用::cudaSetDevice()来访问设备。

  • deviceQuery, CUDA Driver = CUDART, CUDA Driver Version = 12.0, CUDA Runtime Version = 11.6, NumDevs = 1, Device0 = NVIDIA GeForce RTX 4090: CUDA设备查询的结果。

  • Result = PASS: 查询结果通过验证。

 

  • 10
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
根据你提供的信息,`/usr/local/cuda/bin/nvcc` 是一个与CUDA相关的命令。CUDA是一个由NVIDIA提供的并行计算平台和编程模型,用于利用NVIDIA GPU进行高性能计算。 如果你在使用某个CUDA相关的命令时遇到了问题,可能是以下几种情况导致的: 1. CUDA未正确安装:请确保你已经按照官方文档的说明正确安装了CUDA,并且安装过程中没有出现任何错误。 2. 环境变量配置问题:CUDA安装后,你需要将相关的环境变量正确配置到你的系统中。特别是,你需要将CUDA的bin目录添加到你的PATH环境变量中,这样系统才能找到nvcc命令。你可以在终端中使用以下命令来添加环境变量: ``` export PATH=/usr/local/cuda/bin:$PATH ``` 如果你希望每次启动终端时都自动配置这些环境变量,可以将上述命令添加到你的bash配置文件(如~/.bashrc)中。 3. CUDA版本不兼容:如果你的CUDA版本与你正在使用的软件或库不兼容,可能会导致问题。请确保你的CUDA版本与你使用的软件或库要求的版本相匹配。 4. 其他问题:如果以上方法都无法解决问题,可能是其他原因导致。你可以尝试重新安装CUDA,更新驱动程序,或者向相关的技术论坛或社区寻求帮助以获取更详细的指导。 希望这些信息能对你有所帮助,如果你有更具体的问题,请提供更多详细的信息,我将尽力帮助你解决问题。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值