OpenCL
文章平均质量分 55
菜鸟决心努力A-A
我不喜欢bug,呜呜呜呜呜呜
展开
-
菜鸟为啥开始学OpenCL~
http://blog.csdn.net/leonwei/article/details/8893796OpenCL的抽象架构与内存模型:原创 2014-02-26 16:35:05 · 546 阅读 · 0 评论 -
clCreateProgramWithBinary 和 clCreateProgramWithSource
摘录:使用clCreateProgramWithSource()创建完的是一个包含源代码的程序对象;要运行设备上的OpenCL程序必须对它进行编译、连接;而对于用clCreateProgramWithBinary创建的程序对象,则只需要进行连接。最后构建成一个完整的可加载的执行程序。我们通过clBuildProgram这个函数来构建OpenCL程序。(即,到buildProgram这一步,原创 2014-02-28 09:19:43 · 4728 阅读 · 0 评论 -
AMD驱动安装
Centos7,S9000*8安装驱动。在官网上选显卡对应的驱动,一般安装就不会有什么问题。安装过程中出现,load fglrx modules error,还是因为fglrx没有编译通过,原因是kernel,kernel-devel,kernel-headers版本不一样,因为安装过程中执行脚本,会需要编译,就会根据kernel版本信息调用相应版本的kernel-devel包之类的,原创 2015-08-14 16:29:13 · 933 阅读 · 0 评论 -
GPU性能调试技巧
目录: 1. linux下调整Nvidia GPU的频率正文: 1. Linux下调整Nvidia GPU的频率查看所有可能的频率值:cat /sys/kernel/debug/clock/gbus/possible_rates 72000 108000 180000 252000 324000 396000 468000 540000 612000 648000 684000 708000原创 2016-01-04 16:29:45 · 4990 阅读 · 0 评论 -
OpenCL性能调试
越简单,越高效。每个线程处理的数据太多,线程间,数据访问区域间隔大,不利于让多个线程共用一个cache line.原创 2015-02-03 14:36:10 · 2847 阅读 · 0 评论 -
debug bug experience1
2016.06.02 写了个测试程序,其中引用了cuda的thrust库,且用nvcc编译 但是由于文件名为main.cpp(坑爹)而不是main.cu(正解),出现了很凌乱的thrust报的bug,随便看看,感受一下吧: 2016.5.28 对于CUDA,出现并发的数据访问时,该数据会被置为0;对于global,shared都是这样2016.5.25 使用&、|之类的为操作,要注意他的优原创 2015-12-08 17:29:24 · 1170 阅读 · 0 评论 -
OpenCL性能调试1
2015.12.08不说那么多背景问题了,就是有个事儿:在频率可调的GPU卡上,如果GPU将频率调至比较低的状态,性能不仅会有下降,还会出现稳定的情况,即性能波动很大,而且尤其是在开始的时候,性能特别低,然后缓慢提升,然后还是稍有不稳定。原创 2015-12-08 16:31:04 · 794 阅读 · 0 评论