cuda
zdy0_2004
这个作者很懒,什么都没留下…
展开
-
Cuda 相关库的介绍
Cuda 相关库的介绍分类: 并行计算2013-02-26 10:42 835人阅读 评论(0) 收藏 举报Cuda在努力构造一个类似CPP的完整的编程环境,所以他提供了一系列的库。http://docs.nvidia.com/cuda/index.html1) math API类比C的math库有三角函数、对数、指数等基本的函数。2) th转载 2014-11-26 22:50:16 · 637 阅读 · 0 评论 -
《GPU的革命》文章整理
CUDA 线程执行模型分析(一)招兵------ GPU的革命CUDA 线程执行模型分析(二)大军未动粮草先行------GPU的革命CUDA硬件实现分析(一)------安营扎寨-----GPU的革命CUDA硬件实现分析(二)------规行矩步------GPU的革命CUDA编程接口(一)------一十八般武器------GPU的革命CUDA编程接口(二)------一十八般武器------转载 2014-12-26 21:45:56 · 551 阅读 · 0 评论 -
Dynamic Parallelism
CUDA ---- Dynamic ParallelismDynamic Parallelismhttp://www.cnblogs.com/1024incn/p/4557156.html到目前为止,所有kernel都是在host端调用,GPU的工作完全在CPU的控制下。CUDA Dynamic Parallelism允许GPU kernel在device端创建转载 2015-06-07 13:34:36 · 1596 阅读 · 0 评论 -
GPU 加速NLP任务(Theano+CUDA)
http://www.cnblogs.com/chenbjin/p/5021314.html 之前学习了CNN的相关知识,提到Yoon Kim(2014)的论文,利用CNN进行文本分类,虽然该CNN网络结构简单效果可观,但论文没有给出具体训练时间,这便值得进一步探讨。 Yoon Kim代码:https://github.com/yoonkim/CNN_sentence转载 2015-12-05 21:58:57 · 1464 阅读 · 0 评论 -
CUDA范例精解通用GPU架构-(1)Tesla服务器Kepler架构和万年的HelloWorld
CUDA范例精解通用GPU架构-(1)Tesla服务器Kepler架构和万年的HelloWorld结合CUDA范例精解以及CUDA并行编程。由于正在学习CUDA,CUDA用的比较多,因此翻译一些个人认为重点的章节和句子,作为学习,程序将通过NVIDIA K40服务器得出结果。如果想通过本书进行CUDA编程,又不太懂CUDA和GPU的架构,可以将这个博客作为入门博客(但是希望你能有些基础,因转载 2016-03-21 14:05:03 · 1764 阅读 · 0 评论 -
CUDA范例精解通用GPU架构-(2)其实写个矩阵相乘并不是那么难
http://www.cnblogs.com/yusenwu/p/5300956.html 程序代码及图解析:123456789101112131415161718#include #incl转载 2016-03-21 18:13:27 · 3199 阅读 · 0 评论 -
CUDA ---- Stream and Event
http://www.cnblogs.com/1024incn/p/5891051.htmlStream一般来说,cuda c并行性表现在下面两个层面上:Kernel levelGrid level到目前为止,我们讨论的一直是kernel level的,也就是一个kernel或者一个task由许多thread并行的执行在GPU上。Stream的概转载 2016-09-21 00:16:23 · 1011 阅读 · 0 评论