OpenCL
小牛蛋
关注Linux下多线程开发 并行与分布式计算 对区块链 机器学习 密码学有浓厚兴趣
展开
-
OpenCL 学习step by step (3) 存储kernel文件为二进制
转自:http://www.cnblogs.com/mikewolf2002/archive/2012/09/06/2674125.html作者: 迈克老狼2012在教程2中,我们通过函数convertToString,把kernel源文件读到一个string串中,然后用函数clCreateProgramWithSource装入程序对象,再调用函数clBuildProgram编译转载 2013-08-15 22:34:48 · 2007 阅读 · 0 评论 -
OpenCL 学习step by step (2) 一个简单的OpenCL的程序
转自:http://www.cnblogs.com/mikewolf2002/archive/2012/09/05/2671261.html作者:迈克老狼2012现在,我们开始写一个简单的OpenCL程序,计算两个数组相加的和,放到另一个数组中去。程序用cpu和gpu分别计算,最后验证它们是否相等。OpenCL程序的流程大致如下:下面是source code转载 2013-08-15 22:28:36 · 2831 阅读 · 0 评论 -
OpenCL性能优化实例研究系列2:避免Local Memory Bank Conflicts的两个简单方法
转自:http://hi.baidu.com/fsword73/item/51df1fafe6083e268919d39e作者: fsword73Bank Conflicts 是存储访问中的常见问题,避免Bank Conflicts有效地提高存储访问速度。下面介绍两个实例, Reduction和Prefix Sum.1 在Reduction中使用Padding避免Bank转载 2013-08-15 22:41:17 · 5104 阅读 · 0 评论 -
OpenCL多卡编程
之前做过NVIDIA CUDA多卡,在Linux下用原创 2014-06-30 21:54:32 · 1447 阅读 · 1 评论