CUDA
zhbxlm
主要从事GPU加速,嵌入式方面
展开
-
关于CUDA操作中的原子问题
好久不写博客了,慢慢的感觉自己懒散好多,废话不说,看看关于原子操作吧 关于CUDA的书一本接着一本,算来看了好多本,在做CT重建中FDK,也算是有个结果了吧,不过后期优化还没有做,想看看关于CUDA的一些simple,那就从第一个开始吧,结果第一个是关于CUDA的动态并行的,也就是递归调用的,项目名字叫cdpSimplePrint,调试结果分析,发现原子操作的结果并不是自己以前认为的。原创 2015-04-02 11:40:02 · 2184 阅读 · 0 评论 -
关于CUDA6.5中newdelete的解读
最近在检查自己项目中存在的问题,涉及到了new 和 delete 的问题,于是查找CUDA6.5中的simple,中间有关于newdelete的例子,我本想随意参考一下吧,没想到,这次参考倒是让我研究了整整一天多的时间 这里贴出部分代码:templateclass Vector : public Container {public: // Con原创 2015-04-28 21:37:04 · 1383 阅读 · 0 评论 -
关于CUDA实现最值问题
一转眼一周就过去了,算来入职已经半个月了,项目也进行了十来天,感觉这一周受到最纠结的莫过于寻最值问题了。 听起来寻最值应该是个很简单的问题,当时的思路是这样的,并行规约寻最值,并记录下标,于是有了第一版的程序: __global__ void Max_Reduce(int *d_array, int array_len, int *max_value原创 2016-07-23 21:51:36 · 3787 阅读 · 2 评论 -
工作随笔1
毕业了,来到北京工作也有十天了(七月八号入职,今天七月十八号),整体感觉北京很大,随便走个地方就需要三四十分钟以上,北京也很小,没钱刚毕业的我们十四个人住在了一间套间宿舍(有一天我下床的时候不小心踩到了下铺兄弟的脑袋)。 好了,不说这些,记录些自己的工作收获吧。 这是我从事的第一份工作----软件工程师(GPU算法加速)。感觉人生就是这么奇怪,往往有心栽花花不发,无原创 2016-07-18 23:27:56 · 532 阅读 · 0 评论 -
一种不能进行gpu加速的折中方法
做了大概半个月的项目,发现给出的要求是即使优化到极致也是无法做到的,心累。 重新对项目做了评估讨论,倒是很像openMPI,是对一包包数据进行处理的。最后讨论的结果是使用多进程多核进行处理,经过一周的开发,发现在服务器端来做这种处理得到了十分良好的效果,只是会出现很长时间CPU占用率100%,内存也有明显的上升。于是对项目主控端加入了新的线程,对CPU使用率和内存进行检测来控原创 2016-08-15 23:27:21 · 556 阅读 · 0 评论 -
CUDA规约前缀求和问题
CUDA规约前缀求和问题 前缀求和问题算是个比较常见的问题了,这周项目中遇到了个这样的问题,查找数组a中所有值为M的元素,用数组b将依次存储这些元素的下标。 这也算是比较经典的前缀求和的问题了。原创 2016-07-31 00:50:02 · 2935 阅读 · 0 评论