![](https://img-blog.csdnimg.cn/20201014180756738.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
OpenCL
文章平均质量分 84
韩大先生1
天马行空的程序员。关注人工智能,动漫。
常常思考如何省事,如何过上悠闲的日子。
展开
-
OpenCL全局同步案例分析
openCL作为GPU编程的一种工具库,编程方式 与CPU上不同,尤其是 线程同步。GPU编程,为了充分利用硬件特性,会开启大量的计算线程,几千甚至几万个逻辑线程。对于一些复杂的计算过程,往往需要分步骤执行,即存在同步点。例如:A步骤1000个线程执行完毕后(同步点),再B步骤500个线程执行,执行完毕后(同步点),再执行C....等。 本人对不同的 同步方法进行了原创 2017-09-06 17:50:10 · 1126 阅读 · 0 评论 -
C#(Csharp)+OpenCL+CLBLAS库,实现GPU高性能计算。
C#调用GPU计算。opencl 和 cuda 是两大老牌 GPU计算库。这里选择了 opencl ,因为它不挑显卡。而且手机上也能用。甚至没有独显,集显也行,再没有CPU也行。在cpu上跑也有少量性能提升。NOpenCL库这里用到 C#的 NOpenCL库,调用 opencl 实现调用 显卡GPU计算。一般开发opencl 用C++。这里为了C#能用,尝试了 opencl.n原创 2017-09-27 12:01:07 · 7825 阅读 · 2 评论 -
OpenCL性能对比测试案例,合理使用clfinish()函数,充分发挥指令队列(commandqueue)特性。
用的公司的电脑,配置如下:CPU: AMD Athlon X4 830 (3.0GHz 四核)内存: 8GBGPU: nVIDIA GT710 (0.954GHz 192cores 1CU)显存: 1GB上图,浮点性能测试。CPU的 float 浮点性能 91.95GFlops。GPU为 320.1GFlops。浮点数计算 GPU领先 3原创 2017-09-20 10:19:39 · 4757 阅读 · 4 评论