古月的博客

博客是写给自己看的,请不要评论,恕不回复。

【GPU】基于VS2012 的NVIDA OpenCL安装与配置

本博客涉及图像处理任务的加速问题,使用通用图像处理单元GPGPUs(General Purpose Graphics Processing Units),或简而言之,带并行处理的GPU,GPU本质上是一个专门为图形处理或浮点运算而设计的协处理器,目标是改善诸如视频游戏和交互三维图形之类的应用程序性能。当图形在GPU上执行时,CPU可以用来进行其他计算(如游戏中的人工智能部分)。

OPENCV库中包含了对OPENCL和CUDA GPU架构的支持,但是OPENCL得到更多设备的支持,甚至包含在一些NVIDIA图形卡中。

最近在学习OpenCL,想着搭建OpenCL的编码环境,自己编几个程序练习练习。要编程,那第一步就是要搭建编程环境了。

  我的PC上安装过VS2012,配置好了OPENCV,这个节省了不少时间。使用OpenCL编程,不可避免地要使用到图像处理,OpenCV是最佳选择了。

1、 检测PC对OpenCL的支持情况

2008年,苹果公司向Khronos Group提交了一份关于跨平台计算框架的草案,该草案由苹果公司开发,并与AMD、IBM、Intel和NVIDIA公司合作逐步完善。这个跨平台计算框架就是OpenCL(Open Computing Language,开放计算语言)。2008年12月8日,OpenCL 1.0技术规范发布。2010年6月14日,OpenCL 1.1发布。2011年11月19日,OpenCL 1.2发布。2013年11月19日,OpenCL 2.0发布。

从OpenCL技术规范的发布历史看,2008年以前的PC一定是不支持OpenCL的。之后的芯片,也会因为年份不同、厂商不同,对OpenCL的版本支持不同。

  怎么能准确地知道自己PC对OpenCL及OpenGL的支持情况呢?我们可以利用GPU-Z的工具来查看它可以很详细地检测到你的PC的GPU情况,以及对OpenCL/OpenGL/CUDA/Vulkan的支持。这是我主机配置截图:

     可以看到我的主机显卡是NVIDA GetForce GTX750,在最下面一栏Computing中显示支持OpenCL,CUDA                

2、OpenCL安装及环境配置

     查阅资料,发现对于NVIDA的显卡,并没有单独的OpenCL SDK供安装使用,它是被CUDA SDK Tookits包含的,所以我们只需要下载安装CUDA   Tookit即可,我安装的是目前最新的版本CUDA Tookit 8.0。选择与自己系统匹配的版本,安装即可。安装好CUDA之后,OpenCL的配置就已经完成了80%了,剩下的工作就是把OpenCL的路径添加到工程中。

  根据我的PC上GPU的型号,我下载NVIDIA的OpenCL驱动。在下面的网页上下载了cuda_8.0.61.exe:

  https://developer.nvidia.com/cuda-downloads

  安装时默认安装到了C盘(安装所占内存较大,可以安装在其他盘,安装在其他盘的话,也会在c盘生成如下路径C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v8.0,我们要配置的东西就在这里),具体目录为:

  C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v8.0



测试CUDA安装成功与否


打开VS2015(VS2012),选择新建一个项目,可以看到,已安装模板下边多了一个NVIDIA选项,说明安装成功!



  接下来,在VS2012中建立新工程,配置OpenCL的相关路径,对OpenCL安装是否成功做了检测。具体步骤如下:

首先,创建了Visual C++下的Win32控制台应用程序opencl_test。接着配置OpenCL的路径。在工程属性页的“VC++ 目录”下,配置它的“包含目录”和“库目录”。

(1)“包含目录”中选择路径:

  C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v8.0\include

(2)“库目录”中选择路径:

    C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v8.0\lib\Win32

需要注意的是,因为我创建的是Win32控制台应用程序,必须选择lib下的Win32目录,而不能选择x64目录。

(3)接下来对“链接器”的“输入”页面进行配置。在它的“附加依赖项”中添加库OpenCL.lib即可

3、经过以上步骤,OpenCL编译环境就已经配置好了,可以把属性页“OpenCL.props”保存起来,下次直接这个属性页就可以了,不用每次都重复配置。以下是测试程序:

  1. #include <stdio.h>    
  2. #include <stdlib.h>    
  3. #include <iostream>    
  4. #include <CL/cl.h>    
  5.   
  6.   
  7. int main()  
  8. {  
  9.     //cl_platform 表示一个OpenCL的执行平台,关联到GPU硬件,如N卡,AMD卡  
  10.     cl_platform_id *platforms;  
  11.   
  12.     //OpenCL中定义的跨平台的usigned int和int类型  
  13.     cl_uint num_platforms;  
  14.     cl_int i, err, platform_index = -1;  
  15.   
  16.     char* ext_data;  
  17.     size_t ext_size;  
  18.     const char icd_ext[] = "cl_khr_icd";  
  19.   
  20.     //要使platform工作,需要两个步骤。1 需要为cl_platform_id结构分配内存空间。2 需要调用clGetPlatformIDs初始化这些数据结构。一般还需要步骤0:询问主机上有多少platforms    
  21.   
  22.     //查询计算机上有多少个支持OpenCL的设备  
  23.     err = clGetPlatformIDs(5, NULL, &num_platforms);  
  24.     if (err < 0)  
  25.     {  
  26.         perror("Couldn't find any platforms.");  
  27.         exit(1);  
  28.     }  
  29.     printf("本机上支持OpenCL的环境数量: %d\n", num_platforms);  
  30.   
  31.     //为platforms分配空间                                                   
  32.     platforms = (cl_platform_id*)  
  33.         malloc(sizeof(cl_platform_id) * num_platforms);  
  34.   
  35.     clGetPlatformIDs(num_platforms, platforms, NULL);  
  36.   
  37.     //获取GPU平台的详细信息   
  38.     for (i = 0; i < num_platforms; i++)  
  39.     {  
  40.         //获取缓存大小  
  41.         err = clGetPlatformInfo(platforms[i],  
  42.             CL_PLATFORM_EXTENSIONS, 0, NULL, &ext_size);  
  43.         if (err < 0)  
  44.         {  
  45.             perror("Couldn't read extension data.");  
  46.             exit(1);  
  47.         }  
  48.   
  49.         printf("缓存大小: %d\n", ext_size);  
  50.   
  51.         ext_data = (char*)malloc(ext_size);  
  52.   
  53.         //获取支持的扩展功能  
  54.         clGetPlatformInfo(platforms[i], CL_PLATFORM_EXTENSIONS,  
  55.             ext_size, ext_data, NULL);  
  56.         printf("平台 %d 支持的扩展功能: %s\n", i, ext_data);  
  57.   
  58.         //获取显卡的名称    
  59.         char *name = (char*)malloc(ext_size);  
  60.         clGetPlatformInfo(platforms[i], CL_PLATFORM_NAME,  
  61.             ext_size, name, NULL);  
  62.         printf("平台 %d 是: %s\n", i, name);  
  63.   
  64.         //获取显卡的生产商名称    
  65.         char *vendor = (char*)malloc(ext_size);  
  66.         clGetPlatformInfo(platforms[i], CL_PLATFORM_VENDOR,  
  67.             ext_size, vendor, NULL);  
  68.         printf("平台 %d 的生产商是: %s\n", i, vendor);  
  69.   
  70.         //获取平台版本   
  71.         char *version = (char*)malloc(ext_size);  
  72.         clGetPlatformInfo(platforms[i], CL_PLATFORM_VERSION,  
  73.             ext_size, version, NULL);  
  74.         printf("平台 %d 的版本信息: %s\n", i, version);  
  75.   
  76.         //查询显卡是独立的还是嵌入的   
  77.         char *profile = (char*)malloc(ext_size);  
  78.         clGetPlatformInfo(platforms[i], CL_PLATFORM_PROFILE,  
  79.             ext_size, profile, NULL);  
  80.         printf("平台 %d 是独立的(full profile)还是嵌入式的(embeded profile)?: %s\n", i, profile);  
  81.   
  82.         //查询是否支持ICD扩展  
  83.         if (strstr(ext_data, icd_ext) != NULL)  
  84.             platform_index = i;  
  85.         std::cout << "平台ID = " << platform_index << std::endl;  
  86.         /* Display whether ICD extension is supported */  
  87.         if (platform_index > -1)  
  88.             printf("平台 %d 支持ICD扩展: %s\n",  
  89.                 platform_index, icd_ext);  
  90.         std::cout << std::endl;  
  91.   
  92.         //释放空间    
  93.         free(ext_data);  
  94.         free(name);  
  95.         free(vendor);  
  96.         free(version);  
  97.         free(profile);  
  98.     }  
  99.   
  100.     if (platform_index <= -1)  
  101.         printf("No platforms support the %s extension.\n", icd_ext);  
  102.     getchar();  
  103.   
  104.     //释放资源  
  105.     free(platforms);  
  106.     return 0;  
  107. }  

在本机上执行输出:


调用OpenCL的API获取了本机支持OpenCL平台的数目,为2。因为我的PC上有Intel的继承显卡和NVIDIA的独立显卡。通过这个小程序,我们验证OpenCL+OpenCV环境是可以正常工作的。之后就可以基于这个环境完成更多的程序设计了。


阅读更多
想对作者说点什么? 我来说一句

没有更多推荐了,返回首页

加入CSDN,享受更精准的内容推荐,与500万程序员共同成长!
关闭
关闭