i.MX6Q OpenCL with QT4.8.4

最新推荐文章于 2023-07-19 17:08:34 发布

朝花夕拾AutoMan

最新推荐文章于 2023-07-19 17:08:34 发布

阅读量1.7k

点赞数

分类专栏： QT FreeScale 嵌入式 OpenCL 文章标签： I.MX6QSabreLite QT4.8.4 opencl

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/romeolikejuliet/article/details/50160521

版权

QT 同时被 3 个专栏收录

9 篇文章 0 订阅

订阅专栏

4 篇文章 0 订阅

订阅专栏

4 篇文章 0 订阅

订阅专栏

开发板：Sabrelite
参考：飞思卡尔教程i.MX6Q OpenCL Hello World

1、建立qt控制台工程。

2、我的BSP 由英蓓特公司提供的版本，使用自带的文件系统，include 目录位于我的电脑的。。。

但是我好像并没有找到CL的头文件。

我复制电脑中Nvida GPU Computing Kit 中的CL文件夹到Ubuntu中来，

将CL文件夹放入 /home/wps/programs/timesys/i_MX6QSABRELite/rfs/rootfs/usr/include/中，

OpenCL的库libOpenCL.so 和 libCLC.so 位于/home/wps/programs/timesys/i_MX6QSABRELite/rfs/rootfs/usr/lib/中。

或者在这里下载：i.MX6Q opencl include and lib

3、将OpenCL的头文件和库文件加入qt工程中的pro文件中。

如：

INCLUDEPATH += //home/wps/programs/timesys/i_MX6QSABRELite/rfs/rootfs/usr/include

LIBS += -L/home/wps/programs/timesys/i_MX6QSABRELite/rfs/rootfs/usr/lib -lOpenCL -lCLC

将源代码复制替换掉main.cpp。

//************************************************************

// Demo OpenCL application to compute a simple vector addition

// computation between 2 arrays on the GPU

// ************************************************************

#include <stdio.h>

#include <stdlib.h>

#include <CL/cl.h>

//

// OpenCL source code

const char* OpenCLSource[] = {

"__kernel void VectorAdd(__global int* c, __global int* a,__global int* b)",

"{",

" // Index of the elements to add \n",

" unsigned int n = get_global_id(0);",

" // Sum the nth element of vectors a and b and store in c \n",

" c[n] = a[n] + b[n];",

"}"

// Some interesting data for the vectors

int InitialData1[20] = {37,50,54,50,56,0,43,43,74,71,32,36,16,43,56,100,50,25,15,17};

int InitialData2[20] = {35,51,54,58,55,32,36,69,27,39,35,40,16,44,55,14,58,75,18,15};

// Number of elements in the vectors to be added

#define SIZE 100

// Main function

// ************************************************************

int main(int argc, char **argv)

{

// Two integer source vectors in Host memory

int HostVector1[SIZE], HostVector2[SIZE];

//Output Vector

int HostOutputVector[SIZE];

// Initialize with some interesting repeating data

for(int c = 0; c < SIZE; c++)

{

HostVector1[c] = InitialData1[c%20];

HostVector2[c] = InitialData2[c%20];

HostOutputVector[c] = 0;

}

//Get an OpenCL platform

cl_platform_id cpPlatform;

clGetPlatformIDs(1, &cpPlatform, NULL);

// Get a GPU device

cl_device_id cdDevice;

clGetDeviceIDs(cpPlatform, CL_DEVICE_TYPE_GPU, 1, &cdDevice, NULL);

char cBuffer[1024];

clGetDeviceInfo(cdDevice, CL_DEVICE_NAME, sizeof(cBuffer), &cBuffer, NULL);

printf("CL_DEVICE_NAME: %s\n", cBuffer);

clGetDeviceInfo(cdDevice, CL_DRIVER_VERSION, sizeof(cBuffer), &cBuffer, NULL);

printf("CL_DRIVER_VERSION: %s\n\n", cBuffer);

// Create a context to run OpenCL enabled GPU

cl_context GPUContext = clCreateContextFromType(0, CL_DEVICE_TYPE_GPU, NULL, NULL, NULL);

// Create a command-queue on the GPU device

cl_command_queue cqCommandQueue = clCreateCommandQueue(GPUContext, cdDevice, 0, NULL);

// Allocate GPU memory for source vectors AND initialize from CPU memory

cl_mem GPUVector1 = clCreateBuffer(GPUContext, CL_MEM_READ_ONLY |

CL_MEM_COPY_HOST_PTR, sizeof(int) * SIZE, HostVector1, NULL);

cl_mem GPUVector2 = clCreateBuffer(GPUContext, CL_MEM_READ_ONLY |

CL_MEM_COPY_HOST_PTR, sizeof(int) * SIZE, HostVector2, NULL);

// Allocate output memory on GPU

cl_mem GPUOutputVector = clCreateBuffer(GPUContext, CL_MEM_WRITE_ONLY,

sizeof(int) * SIZE, NULL, NULL);

// Create OpenCL program with source code

cl_program OpenCLProgram = clCreateProgramWithSource(GPUContext, 7, OpenCLSource, NULL, NULL);

// Build the program (OpenCL JIT compilation)

clBuildProgram(OpenCLProgram, 0, NULL, NULL, NULL, NULL);

// Create a handle to the compiled OpenCL function (Kernel)

cl_kernel OpenCLVectorAdd = clCreateKernel(OpenCLProgram, "VectorAdd", NULL);

// In the next step we associate the GPU memory with the Kernel arguments

clSetKernelArg(OpenCLVectorAdd, 0, sizeof(cl_mem), (void*)&GPUOutputVector);

clSetKernelArg(OpenCLVectorAdd, 1, sizeof(cl_mem), (void*)&GPUVector1);

clSetKernelArg(OpenCLVectorAdd, 2, sizeof(cl_mem), (void*)&GPUVector2);

// Launch the Kernel on the GPU

// This kernel only uses global data

size_t WorkSize[1] = {SIZE}; // one dimensional Range

clEnqueueNDRangeKernel(cqCommandQueue, OpenCLVectorAdd, 1, NULL,

WorkSize, NULL, 0, NULL, NULL);

// Copy the output in GPU memory back to CPU memory

clEnqueueReadBuffer(cqCommandQueue, GPUOutputVector, CL_TRUE, 0,

SIZE * sizeof(int), HostOutputVector, 0, NULL, NULL);

// Cleanup

clReleaseKernel(OpenCLVectorAdd);

clReleaseProgram(OpenCLProgram);

clReleaseCommandQueue(cqCommandQueue);

clReleaseContext(GPUContext);

clReleaseMemObject(GPUVector1);

clReleaseMemObject(GPUVector2);

clReleaseMemObject(GPUOutputVector);

for( int i =0 ; i < SIZE; i++)

printf("[%d + %d = %d]\n",HostVector1[i], HostVector2[i], HostOutputVector[i]);

return 0;

}

结果如下，截取部分结果。

朝花夕拾AutoMan

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

朝花夕拾AutoMan CSDN认证博客专家 CSDN认证企业博客

码龄9年

26: 原创

40万+: 周排名

42万+: 总排名

6万+: 访问

: 等级

803: 积分

31: 粉丝

15: 获赞

12: 评论

103: 收藏

私信

关注

热门文章

分类专栏

ROS 2篇
Apollo 6篇
嵌入式 4篇
FreeScale 4篇
QT 9篇
OpenCV 4篇
OpenCL 2篇
Ibeo 1篇
GLPK 1篇
MSP432
C/C++ 1篇
Android
ArcGIS 1篇
Linux 1篇
ARM 1篇
i.MX287 1篇
MxNet

最新评论

MSP-EXP4320P401R使用---Keil的使用与Debug【1】
servo-contr ol: 博主，请问那个开关有什么作用呀？数据手册上好像没有提到
[Qt配置指南—5]Qt 5.4.2 Configure Options---Qt for Embeded Linux嵌入式Linux
Three_Bulls: 大神，Qt（Opengl）交叉编译如何实现。硬件没有3D加速，载编译的时候，只要加上OpenGL,就会报OpenGL ES2.0不存在
[Qt配置指南—5]Qt 5.4.2 Configure Options---Qt for Embeded Linux嵌入式Linux
朝花夕拾AutoMan: EB101IWSWD-eyJsaWNlbnNlSWQiOiJFQjEwMUlXU1dEIiwibGljZW5zZWVOYW1lIjoibGFuIHl1IiwiYXNzaWduZWVOYW1lIjoiIiwiYXNzaWduZWVFbWFpbCI6IiIsImxpY2Vuc2VSZXN0cmljdGlvbiI6IkZvciBlZHVjYXRpb25hbCB1c2Ugb25seSIsImNoZWNrQ29uY3VycmVudFVzZSI6ZmFsc2UsInByb2R1Y3RzIjpbeyJjb2RlIjoiSUkiLCJwYWlkVXBUbyI6IjIwMTgtMTAtMTQifSx7ImNvZGUiOiJSUzAiLCJwYWlkVXBUbyI6IjIwMTgtMTAtMTQifSx7ImNvZGUiOiJXUyIsInBhaWRVcFRvIjoiMjAxOC0xMC0xNCJ9LHsiY29kZSI6IlJEIiwicGFpZFVwVG8iOiIyMDE4LTEwLTE0In0seyJjb2RlIjoiUkMiLCJwYWlkVXBUbyI6IjIwMTgtMTAtMTQifSx7ImNvZGUiOiJEQyIsInBhaWRVcFRvIjoiMjAxOC0xMC0xNCJ9LHsiY29kZSI6IkRCIiwicGFpZFVwVG8iOiIyMDE4LTEwLTE0In0seyJjb2RlIjoiUk0iLCJwYWlkVXBUbyI6IjIwMTgtMTAtMTQifSx7ImNvZGUiOiJETSIsInBhaWRVcFRvIjoiMjAxOC0xMC0xNCJ9LHsiY29kZSI6IkFDIiwicGFpZFVwVG8iOiIyMDE4LTEwLTE0In0seyJjb2RlIjoiRFBOIiwicGFpZFVwVG8iOiIyMDE4LTEwLTE0In0seyJjb2RlIjoiUFMiLCJwYWlkVXBUbyI6IjIwMTgtMTAtMTQifSx7ImNvZGUiOiJDTCIsInBhaWRVcFRvIjoiMjAxOC0xMC0xNCJ9LHsiY29kZSI6IlBDIiwicGFpZFVwVG8iOiIyMDE4LTEwLTE0In0seyJjb2RlIjoiUlNVIiwicGFpZFVwVG8iOiIyMDE4LTEwL
ArcGIS10.2在VS2010/VS2012/VS2013 下进行二次开发及编译出错解决
wenyigoudong04: 急需啊，楼主，万分感谢。。
ArcGIS10.2在VS2010/VS2012/VS2013 下进行二次开发及编译出错解决
wenyigoudong04: 楼主，能共享一下arcgis10.2基于C++的包吗，我这不知道为啥只有for .net 和for Java的

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。