CUDA——通过cudaDeviceProp结构体查看GPU设备信息

cudaDeviceProp结构体

cudaDeviceProp数据类型是针对函式cudaGetDeviceProperties定义的,cudaGetDeviceProperties函数的功能是取得支持GPU计算装置的相关属性,比如支持CUDA版本号装置的名称、内存的大小、最大的thread数目、执行单元的频率等。如下所示:

struct cudaDeviceProp {
    char name[256]; // 识别设备的ASCII字符串(比如,"GeForce GTX 940M")
    size_t totalGlobalMem; // 全局内存大小
    size_t sharedMemPerBlock; // 每个block内共享内存的大小
    int regsPerBlock; // 每个block 32位寄存器的个数
    int warpSize; // warp大小
    size_t memPitch; // 内存中允许的最大间距字节数
    int maxThreadsPerBlock; // 每个Block中最大的线程数是多少
    int maxThreadsDim[3]; // 一个块中每个维度的最大线程数
    int maxGridSize[3]; // 一个网格的每个维度的块数量
    size_t totalConstMem; // 可用恒定内存量
    int major; // 该设备计算能力的主要修订版号
    int minor; // 设备计算能力的小修订版本号
    int clockRate; // 时钟速率
    size_t textureAlignment; // 该设备对纹理对齐的要求
    int deviceOverlap; // 一个布尔值,表示该装置是否能够同时进行cudamemcpy()和内核执行
    int multiProcessorCount; // 设备上的处理器的数量
    int kernelExecTimeoutEnabled; // 一个布尔值,该值表示在该设备上执行的内核是否有运行时的限制
    int integrated; // 返回一个布尔值,表示设备是否是一个集成的GPU(即部分的芯片组、没有独立显卡等)
    int canMapHostMemory; // 表示设备是否可以映射到CUDA设备主机内存地址空间的布尔值
    int computeMode; // 一个值,该值表示该设备的计算模式:默认值,专有的,或禁止的
    int maxTexture1D; // 一维纹理内存最大值
    int maxTexture2D[2]; // 二维纹理内存最大值
    int maxTexture3D[3]; // 三维纹理内存最大值
    int maxTexture2DArray[3]; // 二维纹理阵列支持的最大尺寸
    int concurrentKernels; // 一个布尔值,该值表示该设备是否支持在同一上下文中同时执行多个内核

代码

#include <iostream>
#include "cuda_runtime.h"
#include "device_launch_parameters.h"

using namespace std;

void GetCudaImfo() {
    int deviceCount;
    cudaGetDeviceCount(&deviceCount);
    int dev;
    for (dev = 0; dev < deviceCount; dev++) {
        int driver_version(0), runtime_version(0);
        cudaDeviceProp deviceProp;
        cudaGetDeviceProperties(&deviceProp, dev);
        if (dev == 0)
            if (deviceProp.minor = 9999 && deviceProp.major == 9999)
                cout << endl;
        cout << "使用GPU device " << dev << ": " << deviceProp.name << endl;
        cudaDriverGetVersion(&driver_version);
        cout << "CUDA驱动版本:" << driver_version / 1000 << "." << (driver_version % 1000) / 10 << endl;
        cudaRuntimeGetVersion(&runtime_version);
        cout << "CUDA运行时版本:" << runtime_version / 1000 << "." << (runtime_version % 1000) / 10 << endl;
        cout << "设备计算能力:" << deviceProp.major << "." << deviceProp.minor << endl;
        cout << "显卡时钟频率:" << deviceProp.clockRate * 1e-6f << " GHz" << endl;
        cout << "内存时钟频率:" << deviceProp.memoryClockRate * 1e-3f << " MHz" << endl;
        cout << "内存总线带宽:" << deviceProp.memoryBusWidth << " bit" << endl;
        cout << "总显存大小:" << deviceProp.totalGlobalMem / (1024.0 * 1024.0) << " MB" << endl;
        cout << "总常量内存大小:" << deviceProp.totalConstMem / 1024.0 << " KB" << endl;
        cout << "SM数量:" << deviceProp.multiProcessorCount << endl;
        cout << "每个SM最大线程数:" << deviceProp.maxThreadsPerMultiProcessor << endl;
        cout << "每个线程块(block)共享内存大小:" << deviceProp.sharedMemPerBlock / 1024.0 << " KB" << endl;
        cout << "每个线程块(block)的最大线程数:" << deviceProp.maxThreadsPerBlock << endl;
        cout << "每个线程块(block)的最大可用寄存器数:" << deviceProp.regsPerBlock << endl;
        cout << "线程束(wrap)尺寸:" << deviceProp.warpSize << endl;
        cout << "每个线程块(block)各个维度最大尺寸:" << deviceProp.maxThreadsDim[0] << " x " << deviceProp.maxThreadsDim[1] << " x " << deviceProp.maxThreadsDim[2] << endl;
        cout << "每个线程格(grid)各个维度最大尺寸:" << deviceProp.maxGridSize[0] << " x " << deviceProp.maxGridSize[1] << " x " << deviceProp.maxGridSize[2] << endl;
        cout << "最大存储间距:" << deviceProp.memPitch / (1024.0 * 1024.0) << " MB" << endl;
    }
}


int main()
{
    GetCudaImfo();

    return 0;
}
  • 编译:
nvcc -o get_device_property get_device_property.cu
  • 运行:
./get_device_property 

在这里插入图片描述

参考文章:

  • 8
    点赞
  • 18
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值