- 博客(6)
- 资源 (28)
- 收藏
- 关注
原创 opencl学习(四)
由于opencl内核运行时,clEnqueueNDRangeKernel的第5、6个参数global大小和local大小影响计算效率,甚至执行成功情况,想深入了解一下相关的几个参数。参考平台上运行clinfo的输出,最终在CL_DEVICE_MAX_WORK_GROUP_SIZES这个参数上难以解释。查了很多资料,多数只是说明并不合理。从查阅资料中总结出一下内容,在此分享。信息查询函数
2013-08-23 10:18:56 14391 3
原创 opencl学习(三)
opencl学习任务紧迫,仅看文字资料速度太慢,还是跟着大家一起通过尝试不同代码,边学边学。昨天写了把上次写的一维数组相加的做了修改,变成二维数组相加。初学者就是这么无聊,大家见谅!还是在freescale的i.MX6q上跑的,这个芯片的GPU中work group大小最大为1024,因此一维数组元素个数最大就是1024,二维中也只能width * height #include #incl
2013-08-21 10:37:02 4062 1
原创 opencl学习(二)
看了一些结构介绍后,开始跟着别人的足迹写代码,先写大家经常起步的简单一维数组相加的opencl代码,以此熟悉opencl代码结构。此代码是在freescale的i.MX6q上跑的,通过交叉编译工具,加上opencl库和头文件等编译选项进行编译。#include #include #include #include #include #include using namespac
2013-08-21 10:20:34 2690 1
转载 OpenCL优化应用项目
OpenCL优化应用项目1、计算机视觉相关基于局部域考察的图像模糊化算法的加速实现(表面模糊,高斯模糊)图像模糊化图像模糊化算法的特点是根据被考察点的局部域特征对被考察点的颜色进行调整,由于各被考察点的局部域相对独立,这类算法比较适合于用GPU进行优化,我们通过OpenCL并行编程,并行处理各图像点的局部域,能将图像模糊化的速度提高5倍以上。基于Haar Casc
2013-08-15 09:08:30 5974 3
原创 OpenCL学习笔记(一)
今天看些了入门的东西,对opencl四个模型:平台模型、执行模型、内存模型、程序模型。一知半解,不做评论,只是记录。建立一个opencl程序,一般有一下六步:1.查询并选择一个平台;2.查询设备;3.建立一个上下文;4.建立一个命令序列;5.读/写设备;6.执行内核.其中前三步是平台层,后三者为执行层。
2013-08-08 22:25:24 1984
转载 opencl架构模型
1 异构计算、GPGPU与OpenCL OpenCL是当前一个通用的由很多公司和组织共同发起的多CPU\GPU\其他芯片 异构计算(heterogeneous)的标准,它是跨平台的。旨在充分利用GPU强大的并行计算能力以及与CPU的协同工作,更高效的利用硬件高效的完成大规模的(尤其是并行度高的)计算。在过去利用GPU对图像渲染进行加速的技术非常成熟,但是我们知道GPU的芯片结构擅长大规模
2013-08-08 16:07:10 2128
Linux内核设计与实现(第3版)
2013-06-17
linux设备驱动程序(第三版英文版)
2013-05-15
Linux内核设计与实现_第三版英文版.pdf
2013-05-15
Linux内核设计与实现
2013-05-15
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人