![](https://img-blog.csdnimg.cn/20201014180756754.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
C/C++
文章平均质量分 80
dmjlzygx
这个作者很懒,什么都没留下…
展开
-
(CUDA 编程6).CUDA编程接口(二)------一十八般武器
(CUDA 编程6).CUDA编程接口(二)------一十八般武器作者:赵开勇 来源:http://www.hpctech.com/2009/0818/204.html(CUDA 编程6)CUDA编程接口(二)------一十八般武器------GPU的革命4. 程序运行控制:像Stream,Event,Context, Module, Execution control转载 2012-07-29 09:08:26 · 1041 阅读 · 0 评论 -
(CUDA 编程2).CUDA 线程执行模型分析(二)大军未动粮草先行
(CUDA 编程2).CUDA 线程执行模型分析(二)大军未动粮草先行作者:赵开勇 来源:http://www.hpctech.com/2009/0818/199.html书接上回--《CUDA 线程执行模型分析(一)招兵------ GPU的革命》,经过几天的征兵,将士也招了差不多五六千人,五六千人,就是五六千张嘴,得吃饭。这和我们的CUDA内存模型又有什么相识啦?或许有很多人都参加转载 2012-07-28 19:19:04 · 1679 阅读 · 0 评论 -
(CUDA 编程9).CUDA shared memory使用------GPU的革命
(CUDA 编程9).CUDA shared memory使用------GPU的革命作者:赵开勇 来源:http://www.hpctech.com/2009/0818/207.html这一章节准备写一下shared memory的访问的问题,首先是讲一下shared的memory的两种使用方法,然后讲解一下shared memory的bank conflict的问题,这个是shared转载 2012-07-29 09:20:48 · 2333 阅读 · 0 评论 -
(CUDA 编程7).CUDA内存访问(一)提高篇------按部就班
(CUDA 编程7).CUDA内存访问(一)提高篇------按部就班作者:赵开勇 来源: http://www.hpctech.com/2009/0818/205.html谈到内存的访问,其实也就是几个API函数的调用,感觉也没什么好讲的,知道cudaMalloc,知道cudaMemcpy,还有cudaFree,就应该可以对device上的内存进行分配,然后就可以在device上使用转载 2012-07-29 09:10:19 · 1552 阅读 · 0 评论 -
(CUDA 编程5).CUDA编程接口(一)------一十八般武器
(CUDA 编程5).CUDA编程接口(一)------一十八般武器作者:赵开勇 来源:http://www.hpctech.com/2009/0818/203.html子曰:工欲善其事,必先利其器。我们要把显卡作为通用并行处理器来做并行算法处理,就得知道CUDA给我提供了什么样的接口,就得了解CUDA作为通用高性能计算平台上的一十八般武器(CUDA 编程5) CUDA编程接口(一)-转载 2012-07-28 19:36:07 · 3721 阅读 · 0 评论 -
(CUDA 编程10).CUDA cosnstant使用(一)------GPU的革命
(CUDA 编程10).CUDA cosnstant使用(一)------GPU的革命作者:赵开勇 来源:http://www.hpctech.com/2009/0818/209.html10. CUDA cosnstant使用(一)------GPU的革命序言:最近的事情无比的多,差点就找不到回家的路了,都快忘记出发的起点的时候,冷静下来,侧夜未眠,事情再多,都要一件一件的做好,转载 2012-07-29 09:32:20 · 615 阅读 · 0 评论 -
(CUDA 编程4).CUDA硬件实现分析(二)------规行矩步
(CUDA 编程4).CUDA硬件实现分析(二)------规行矩步作者:赵开勇 来源:http://www.hpctech.com/2009/0818/202.html前面已经讲解了很多概念上的东西,其实CUDA的最重要的两个东西,就是线程和内存。只要掌握了这两个东西,CUDA的东西也就很简单了。它的编写语言是C扩展的,所以,就当C语言用就行了,只是主要它的特殊的几个标志就ok了。(转载 2012-07-28 19:28:06 · 1227 阅读 · 0 评论 -
(CUDA 编程1).CUDA 线程执行模型分析(一)招兵 ------ GPU的革命
(CUDA 编程1).CUDA 线程执行模型分析(一)招兵 ------ GPU的革命作者:赵开勇 来源:http://www.hpctech.com/2009/0818/198.html序:或许看到下面的内容的时候,你会觉得和传统的讲解线程,和一些讲解计算机的书的内容不是很相同。我倒觉得有关计算机,编程这些方面的内容,并不都是深奥难懂的,再深奥难懂的事情,其实本质上也是很简单的。转载 2012-07-28 19:17:30 · 3236 阅读 · 0 评论 -
CUDA DLL 开发流程
CUDA DLL 开发流程作者:赵开勇 来源:http://www.hpctech.com/2009/0818/208.htmlCUDA的DLL开发其实和一般的C/C++的DLL开发是一个原理,当然,DLL的开发就有几种方式,这里就讲最容易理解的,也最直接的方式,然后把代码放出来。大家自己可以琢磨一下其它的方式。CUDA的DLL开发其实和一般的C/C++的DLL开发是一个原转载 2012-07-29 09:24:16 · 872 阅读 · 0 评论 -
(CUDA 编程8).CUDA 内存使用 global 二------GPU的革命
(CUDA 编程8).CUDA 内存使用 global 二------GPU的革命 作者:赵开勇 来源:http://www.hpctech.com/2009/0818/206.html8. CUDA 内存使用 global 二------GPU的革命序言:最近在另一个不写技术的blog上,写了最近的一些事情,或许是释怀以后才会把心理面的事情写出来,很感谢很多朋友能理解我现在的心情转载 2012-07-29 09:12:14 · 964 阅读 · 0 评论 -
(CUDA 编程3).CUDA硬件实现分析(一)------安营扎寨
(CUDA 编程3).CUDA硬件实现分析(一)------安营扎寨作者:赵开勇 来源:http://www.hpctech.com/2009/0818/200.html前面我们已经说到线程的一些概念,但是这些概念都是软环节的。我们常常会听到某某单位说他们的软硬件配置如何如何的好。软件再好,每个士兵都是可造之才,但是如果硬件条件跟不上,也没他们的勇武之地。(CUDA编程3)CUDA硬件转载 2012-07-28 19:20:37 · 1349 阅读 · 0 评论