OpenHero 开勇

Open heart, bravely fly!

赵开勇ID:OpenHero
209889次访问,排名301好友95人,关注者104
OpenHero的文章
原创 234 篇
翻译 2 篇
转载 51 篇
评论 386 篇
OpenHero 开勇的公告
最近评论
OpenHero:就是在计算thread在全局的位置的时候:unsigned int index = xIndex(6) + size_x * yIndex(5); 这里的size_x就是一行一共有多少个士兵(Thread),例如上图,这里一行有3个block每一个block里面的每一行有5个Thread,所以size_x就应该为3×5=15,一个Grid的一行有15个士兵,那刚才叫道的那个人的线性编号就应该……
李求斌:不要气馁,加油
wgbljl:加-keep选项生成.cubin文件,这个文件里有
kclau:你好,
我想請問以下,如何知道每一個thread用多少registers呢?
Gemin:呵呵 支持开勇
文章分类
收藏
    相册
    相册
    自己
    参与的开源项目
    Scilab Robotics Toolbox
    常去的几个地方
    Robocup 机器人足球官方站点
    RTSJ
    感兴趣的开源项目
    Flash得开源代码
    Robocup server
    存档
    软件项目交易
    订阅我的博客
    XML聚合  FeedSky
    订阅到鲜果
    订阅到Google
    订阅到抓虾
    订阅到BlogLines
    订阅到Yahoo
    订阅到GouGou
    订阅到飞鸽
    订阅到Rojo
    订阅到newsgator
    订阅到netvibes

    C/C++C/C++

    原创 Linux&Windows下的IP Multicast 开发收藏

    支持Windows & Linux 下的multicast 代码阅读全文>

    发表于 @ 2008年07月19日 02:20:00|评论(loading...)|收藏

    原创 CUDA VS2005 Express Wizard收藏

    This wizard if for VS2005 Express. Then, you can easy create CUDA application with this wizard in VS2005 Express. We can download here:http://download.csdn.net/user/OpenHero阅读全文>

    发表于 @ 2008年06月11日 22:43:00|评论(loading...)|收藏

    原创 CUDA VS2005 new Wizard support exe lib dll收藏

    两天的修改,修改了几个bug,添加了exe lib dll 向导功能1.修改上两个版本中A single input file is required for a non-link phase when an output file is specified bug,这个bug是由于include的路径中间有空格;md5:45e247967257d5aebf88068a0a833252download: http://forums.nvidia.com/index.php?showtopic=69183阅读全文>

    发表于 @ 2008年06月08日 13:00:00|评论(loading...)|收藏

    原创 CUDA编程接口(二)------一十八般武器------GPU的革命收藏

    CUDA编程接口(二)------一十八般武器------GPU的革命 阅读全文>

    发表于 @ 2008年05月20日 17:01:00|评论(loading...)|收藏

    原创 CUDA编程接口(一)------一十八般武器------GPU的革命收藏

    所谓一十八般武器,不同的年代又有不同的说法,最早的汉武年间的:矛、镗、刀、戈、槊、鞭、锏、剑、锤、抓、戟、弓、钺、斧、牌、棍、枪、叉。到三国的:九长:刀、矛、戟、槊、镗、钺、棍、枪、叉;九短:斧、戈、牌、箭、鞭、剑、锏、锤、抓。再到明清的:弓、弩、枪、刀、剑、矛、盾、斧、钺、戟、黄、锏、挝、殳(棍)、叉、耙头、锦绳套索、白打(拳术)。《水浒传》里的:矛、锤、弓、弩、铳、鞭、锏、剑、链、挝、斧、钺、戈、戟、牌、棒、枪、扒。今天的武术届又有:刀、枪、剑、戟、斧、钺、钩、叉、鞭、锏、锤、抓、镗、棍、槊、棒、拐、流星。400多种古代冷兵器时代的武器,常用的也只有这么多种。也就像我们的API一样,API有无数多个,你自己都可以给自己造几个API出来,常用的,或者就那么多个。要打天下也不能扛着锄头,竹竿干吧。秦国之所以能统一六国,在武器上的统一,提供同一个的型号的武器装备(看秦的历史,就可以发现所有的兵器都是同一型号生产,弓弩上的器件可以互换,从兵马俑坑中找到的剑戟,箭头的尺寸误差很小,都可以互换),也是他能战胜其他六国的很好的基础。阅读全文>

    发表于 @ 2008年05月12日 01:16:00|评论(loading...)|收藏

    原创 推荐几本书---GPU,并行算法,多核收藏

    《并行算法导论》 《快速算法与并行型号处理》 《并行程序设计C、MPI与OpenMPI》 《多核程序设计》 《多核程序设计技术---通过软件多线程提升性能》 《软件优化技术---IA-32平台的高性能手册》 《Win32的多线程程序设计》 《GPU编程精粹1》 《GPU编程精粹2》 《GPU编程精粹3》 《Cg tutorial》阅读全文>

    发表于 @ 2008年05月07日 23:39:00|评论(loading...)|收藏

    原创 CUDA硬件实现分析(二)------规行矩步------GPU的革命收藏

    换位思考。当今的生活,节奏快,任务忙。慢慢的忽略了身边的很多事,很多人。再加上接受“高等”教育的人越来越多,“有自己思想的”人越来越多,慢慢的都习惯从自己的思维角度来思考问题,尤其是读工科的学生更是喜欢按照自己的角度来思考问题。慢慢的忽略了换位思考。有很多朋友说学工科的人都喜欢走极端。或许这个就像金庸小说里面少林高僧给两个偷学少林武功的人的建议。在忙碌的生活和紧张的工作中,找个时间,能让自己停下来,想想做过的事情,让自己忙碌的脚步,休息一会儿。往往在team开发中,遇到问题的时候,就需要沟通和交流,但是沟通和交流的基础就是换位思考。在一个平等的环境中的沟通和交流才能算真正意义上的思想的交流。其实学工科的时候有一个小窍门,那就是找规则。有既定的规则,那就是定理和定义。如果你能找到新规则,那就是新发现,可以写paper。我们遇到新东西的时候,也最好在自己的既有思维中找到影子,找到相同的规则。这样就可以很好的学习新东西。不过往往学工科的思维比较有规则性,在加上平时看的工科的书都是规则性太强,长此以往很容易形成偏执的性格。平时就需要多看一些能扩展思维的书籍,或许能消减一些戾气吧。阅读全文>

    发表于 @ 2008年05月05日 02:19:00|评论(loading...)|收藏

    原创 CUDA硬件实现分析(一)------安营扎寨-----GPU的革命收藏

    CUDA硬件实现分析(一)------安营扎寨------GPU的革命序言:有个不会写计算机程序的朋友看了blog,问我,这个GPU也能当故事写吗?我觉得或许GPU真的算是一场革命吧,他的发展或许在酝酿中,不过到08年底,09年初,一定会有一场轰轰烈烈的竞争。那个时候或许从OS层面都会给人带来震撼。如果把CPU的多core看成由几个特种兵组成的,每个特种兵都手里面都拿着8杆枪(SSE)。那么GPU可以看成农民起义……一上来就是成百上千的人,虽然单兵作战能力比不上CPU的单个core,但是毕竟人数众多。就现在GPU的性能,在并行运算上如果不考虑double硬件的成本,已经早早超过CPU的并行运算能力。这或许就是一场革命,这次革命不知是简简单单的GPU和CPU的转变,而是并行算法和串行算法的竞争。并行算法虽然研究到现在已经有很多年,但是真正的实际运用,离我们普通大众还是差很远。但是GPU,并行计算的出现,一下子把我们和并行计算的距离拉近了好多。现在在学校里面学习计算机的时候都是从串行算法开始,养成了很多固定的串行思维。当遇到问题并行划分的时候,就还带着串行的思想,那就不好了:)阅读全文>

    发表于 @ 2008年04月30日 15:33:00|评论(loading...)|收藏

    原创 CUDA 线程执行模型分析(二)大军未动粮草先行------GPU的革命收藏

    CUDA 线程执行模型分析(二)大军未动粮草先行------GPU的革命书接上回--《CUDA 线程执行模型分析(一)招兵------ GPU的革命》,经过几天的征兵,将士也招了差不多五六千人,五六千人,就是五六千张嘴,得吃饭。这和我们的CUDA内存模型又有什么相识啦?或许有很多人都参加过军训,知道军队里面吃饭吗?到吃饭的时间,各处训练的队伍都拉到食堂前面。先到的就先进去吃,后到的就在外面拉歌,等待下一波,这里我们暂时还不讲解怎么安排每一对吃饭。我们先讲讲每一个Grid手下的兄弟们吃饭都需要那些家伙。阅读全文>

    发表于 @ 2008年04月28日 00:25:00|评论(loading...)|收藏

    原创 CUDA 线程执行模型分析(一)招兵------ GPU的革命收藏

    CUDA 线程执行模型分析(一)招兵------ GPU的革命序:或许看到下面的内容的时候,你会觉得和传统的讲解线程,和一些讲解计算机的书的内容不是很相同。我倒觉得有关计算机,编程这些方面的内容,并不都是深奥难懂的,再深奥难懂的事情,其实本质上也是很简单的。一直以为计算机编程就像小时候搭建积木一样,只要知道游戏规则,怎么玩就看你自己了。或许是从小学那会,就喜欢在做数学题的时候用一些简便方法来解题,养成了一些习惯,喜欢把复杂的问题都会尝试用最简单的额方法来解决,而不喜欢把简单的问题弄得很复杂。不再多说了,有的朋友已经看得不耐烦了……ps:再罗嗦一句,如果下面看不明白的,就当小说看了,要是觉得不像小说,那就当故事看,要是觉得故事不完整,写得太乱,那就当笑话看,在各位学习工作之余能博得大家一笑,也倍儿感荣幸……ps2:想好再说……突然想到了,确实是了一段时间再想到的,既然叫GPU革命,那就得招集队伍啊,下面我就开始招兵了。阅读全文>

    发表于 @ 2008年04月25日 16:20:00|评论(loading...)|收藏

    Csdn Blog version 3.1a
    Copyright © OpenHero 开勇