CUDA
文章平均质量分 91
仙守
1 - 模式识别硕士;
2 - 研究生方向:深度学习,计算机视觉;
3 - 目前工作内容:目标检测,文本识别;
4 - 未来想发展方向:深度学习,机器学习,增强学习;
5 - 目前在用的框架:tensorflow,opencv;
6 - 语言:python(目前在用),cpp(好久没用了),scala(用了半年)
博客园博客(两边内容不完全一致):http://www.cnblogs.com/shouhuxianjian
展开
-
CUDA1-hello world
电脑配置:windows7 sp1 64bit + CUDA6.5 + GeForce GTX780 Ti 显卡中的GPU因为多核可以处理很多相同的操作,相比较来说cpu就像个健全的手,什么活都能干,而gpu就是个非健全的手,只能干特定的事情,但是架不住手多,随便几百上千的。关于从cpu过渡到GPU推荐先看《大规模并行处理器编程实战》中前两章,其中有详细地 讲解人们从cpu关注到gpu的原创 2014-12-20 19:36:05 · 897 阅读 · 0 评论 -
CUDA1.1-函数类型限定符与变量类型限定符
这部分来自于《CUDA_C_Programming_Guide.pdf》,看完《GPU高性能变成CUDA实战》的第四章,觉得这本书还是很好的,是一种循序渐进式的书,值得看,而不是工具书那种,适合入门,看完这章,觉得应该先简单的列下函数类型限定符,顺带列下变量类型限定符。知识是“积少成多”的。ps;极力推荐使用编辑器之神-vim来写代码,正打算没事一点一点的使用这个神器,抛却其他编辑器,每天不需原创 2015-01-05 19:21:44 · 1279 阅读 · 0 评论 -
CUDA2.2-原理之存储器访问
本小节来自《大规模并行处理器编程实战》第四节,该书是很好的从内部原理结构上来讲述了CUDA的,对于理解CUDA很有帮助,借以博客的形式去繁取间,肯定会加入自己个人理解,所以有错误之处还望指正。该书还出版了第二版《programming massively parallel processors a hands-on-approach, 2nd》,第一版相对较旧,第二版还是很好的,而且courser原创 2015-02-04 10:36:34 · 1078 阅读 · 0 评论 -
CUDA2.1-原理之索引与warp
本小节来自《大规模并行处理器编程实战》第四节,该书是很好的从内部原理结构上来讲述了CUDA的,对于理解CUDA很有帮助,借以博客的形式去繁取间,肯定会加入自己个人理解,所以有错误之处还望指正。一、块索引与线程索引 CUDA是细粒度的,数据并行的轻量级线程,在启动一个CUDA的一个Kernel函数的时候,就会创建一个线程网格grid,该网格中的所有线程都是执行该kernel函数的,对于原创 2015-01-27 12:19:24 · 1143 阅读 · 0 评论 -
CUDA2.3-原理之任意长度的矢量求和与用事件来测量性能
__global__ void add( int *a, int *b, int *c) { int tid = threadIdx.x + blockIdx.x *blockDim.x; while (tid < N) { c[tid] = a[tid] + b[tid];//your operation tid += blockDim.x * gridDim.x;原创 2015-03-04 10:43:51 · 741 阅读 · 0 评论 -
CUDA2.4-原理之性能优化及浮点运算
本部分来自于《大规模并行处理器编程实战》第六章、第七章。打算不再看这本书了,准备看《programming massively parallel processors 2nd》,即它的第二版,第一版是09年的,第二版是13年的,虽说第二版可是里面涉及的是cuda4.0 和5.0,然而现在2015年7月,cuda都7.0了,正所谓赶速度,完全赶不上啊。虽然说本书好,不过一个不小心,你费老大劲做的优化原创 2015-07-09 19:59:13 · 4381 阅读 · 0 评论