查询GPU信息

不学习没出路

于 2024-04-24 22:42:27 发布

阅读量342

点赞数 5

分类专栏： CUDA 文章标签：性能优化

本文链接：https://blog.csdn.net/qq_45001063/article/details/138171701

版权

CUDA 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

查询GPU信息

在这里插入图片描述
参数传入：1、事先定义的cudaDeviceProf类型的变量 2、计算机GPU的索引号；
该函数只能在主机中调用；

#include "../tools/common.cuh"
#include <stdio.h>
int main(void)
{
    int device_id = 0;
    ErrorCheck(cudaSetDevice(device_id), __FILE__, __LINE__);

    cudaDeviceProp prop;
    ErrorCheck(cudaGetDeviceProperties(&prop, device_id), __FILE__, __LINE__);

    printf("Device id:                                 %d\n",
        device_id);
    printf("Device name:                               %s\n",
        prop.name);
    printf("Compute capability:                        %d.%d\n",
        prop.major, prop.minor);
    printf("Amount of global memory:                   %g GB\n",
        prop.totalGlobalMem / (1024.0 * 1024 * 1024));
    printf("Amount of constant memory:                 %g KB\n",
        prop.totalConstMem  / 1024.0);
    printf("Maximum grid size:                         %d %d %d\n",
        prop.maxGridSize[0], 
        prop.maxGridSize[1], prop.maxGridSize[2]);
    printf("Maximum block size:                        %d %d %d\n",
        prop.maxThreadsDim[0], prop.maxThreadsDim[1], 
        prop.maxThreadsDim[2]);
    printf("Number of SMs:                             %d\n",
        prop.multiProcessorCount);
    printf("Maximum amount of shared memory per block: %g KB\n",
        prop.sharedMemPerBlock / 1024.0);
    printf("Maximum amount of shared memory per SM:    %g KB\n",
        prop.sharedMemPerMultiprocessor / 1024.0);
    printf("Maximum number of registers per block:     %d K\n",
        prop.regsPerBlock / 1024);
    printf("Maximum number of registers per SM:        %d K\n",
        prop.regsPerMultiprocessor / 1024);
    printf("Maximum number of threads per block:       %d\n",
        prop.maxThreadsPerBlock);
    printf("Maximum number of threads per SM:          %d\n",
        prop.maxThreadsPerMultiProcessor);

    return 0;
}

Device id: 计算机中GPU的设备代号，我只有一个显卡，所以只能是0；
Device name: 显卡名字，我的显卡是Quadro P620；
Compute capability: GPU计算能力，我的主版本是6，次版本是1；
Amount of global memory: 显卡显存大小，我的是4G的显存；
Amount of constant memory: 常量内存大小；
Maximum grid size: 最大网格大小（三个维度分别的最大值）；
Maximum block size: 最大线程块大小（三个维度分别的最大值）；
Number of SMs: 流多处理器数量；
Maximum amount of shared memory per block: 每个线程块最大共享内存数量；
Maximum amount of shared memory per SM: 每个流多处理器最大共享内存数量；
Maximum number of registers per block: 每个线程块最大寄存器内存数量；
Maximum number of registers per SM: 每个流多处理器最大寄存器内存数量；
Maximum number of threads per block: 每个线程块最大的线程数量；
Maximum number of threads per SM: 每个流多处理器最大的线程数量。

查询GPU计算核心数量

CUDA运行时API函数是无法查询GPU的核心数量的（起码我不知道要用哪一个运行时API函数），通过以下代码实现：

/*********************************************************************************************
 * file name  : coresCount.cu
 * author     : 权 双
 * date       : 2023-08-13
 * brief      : 查询GPU计算核心数量
**********************************************************************************************/

#include <stdio.h>
#include "../tools/common.cuh"

int getSPcores(cudaDeviceProp devProp)
{  
    int cores = 0;
    int mp = devProp.multiProcessorCount;
    switch (devProp.major){
     	case 2: // Fermi
      		 	if (devProp.minor == 1) cores = mp * 48;
      		 	else cores = mp * 32;
     	    	break;
     	case 3: // Kepler
      			cores = mp * 192;
      			break;
     	case 5: // Maxwell
      			cores = mp * 128;
     			break;
     	case 6: // Pascal
      			if ((devProp.minor == 1) || (devProp.minor == 2)) cores = mp * 128;
      			else if (devProp.minor == 0) cores = mp * 64;
     			else printf("Unknown device type\n");
      			break;
     	case 7: // Volta and Turing
      			if ((devProp.minor == 0) || (devProp.minor == 5)) cores = mp * 64;
     			else printf("Unknown device type\n");
      			break;
     	case 8: // Ampere
     			if (devProp.minor == 0) cores = mp * 64;
      			else if (devProp.minor == 6) cores = mp * 128;
      			else if (devProp.minor == 9) cores = mp * 128; // ada lovelace
      			else printf("Unknown device type\n");
      			break;
     	case 9: // Hopper
      		   	if (devProp.minor == 0) cores = mp * 128;
      			else printf("Unknown device type\n");
      			break;
     	default:
      			printf("Unknown device type\n"); 
      			break;
      }
    return cores;
}

int main()
{
    int device_id = 0;
    ErrorCheck(cudaSetDevice(device_id), __FILE__, __LINE__);
    cudaDeviceProp prop;
    ErrorCheck(cudaGetDeviceProperties(&prop, device_id), __FILE__, __LINE__);
    printf("Compute cores is %d.\n", getSPcores(prop));
    return 0;
}