自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Cyrosly的专栏

准备钻到袋鼠的袋子里重生,谁知她已经怀孕了

  • 博客(18)
  • 资源 (2)
  • 收藏
  • 关注

原创 SIMD和多核心编程时的一些总结。

1  在计算过程中不涉及输出内存的数据时,应使用_mm*_stream_*(直接写入内存)代替_mm*_store_*,例如:for( i=0; i{    ymm0=_mm256_load_pd(a+i);    ymm1=_mm256_load_pd(b+i);    ymm2=_mm256_add_pd(ymm0,ymm1);    _mm256_stream_pd(

2012-09-25 16:14:06 3548

原创 CUDA4.0 inline PTX汇编程序开发( 0 )

内联PTX汇编具有如下形式:asm(“instop”:”type_symbolic”(or):”type_symbolic”(ir),..);asm(“instop”::”type_symbolic”(r));第二种形式是无输出操作格式,需要使用”::”指示符其中instop是指令操作type_symbolic是类型指示符(可选如下),分别对应与PTX中的数据类型:“h” .s16, .u16“r” .s32, .u32“l” .s64, .u64“f” .f32“d” .f64例如://c=a+bfloa

2011-03-05 12:12:00 3045 3

原创 隐藏的爱

    一次和朋友出去玩,看见了她,当初并不直到她叫什么以及关于她的一切。后来有时间就止不住去她上班的地方从远处看着她,或者当她偶尔从身边路过时,轻轻侧目偷偷看她一眼。但从未感当面正视过她,怕她察觉到。后来偶然的机会知道了她的联系方式,本来已经向她明誓了自己的决心,不管她所说的‘我们是不可能的’是否开始就注定了结局,我都想用自己的热情去将不可能变成可能。但很快她的一句话立刻让我无所适从,整个心都冷了。随后我付诸了自己的承诺,删掉了她的联系方式以及一切痕迹,再也不打扰她。只能把这份感情偷藏于心底。有时间我还是

2011-02-21 02:38:00 1025 1

原创 最近的我,现在的我,以及何去何从的我

    最近事情实在太多,太累,好在终于可以比较放松下性情,虽然工作依然很忙。进步是时时刻刻的,但颓废也是不依不饶的。突然发现原来自己还是比较适合与陌生人或者两个不同世界的人交往,因为容易得罪认识的人,不过我仍然认为如果没有理解和默契,那么朋友就没必要做,坚定斩断绝不回头。我认识的人啊,都是些什么人啊,而我自己又是什么样的人啊。算了,不说这些了,好在我心中的热情还没有泯灭,压力,痛苦,孤独什么的对我来说不过是“那又怎么样”如此而已。我要努力的工作,努力的开拓,去看看姿势是否如一直以来自以为是的那样注定不凡,

2010-10-06 13:17:00 1275 2

原创 纹理对象和采样器对象->CUDA3.0&OpenGL3.3

  在OpenGL3.3中先加入了采样器对象( sampler object ),记得以前做OpenGL程序的时候,有时会遇到需要相同的纹理数据只是filter模式不同而已,但当时由于不支持多个不同属性集共享同一个纹理对象,因此必须分别建立2个不同的纹理对象(当然使多个纹理对象共享同一个pixel buffer来达到此目的),显得很笨拙和浪费。新加入的采样器对象就使这个工作变得容易且合乎逻辑和直觉

2010-03-30 13:29:00 5098 1

原创 CUDA面内存用法总结

最近群里有网友问CUDA中2D GMEM copy的问题,昨天论坛中也有问同样问题的:copy a sub slice of source GMEM to another GMEM,下面详细介绍再不需要内核的情况下如何实现: 测试(从100x100的GMEM区域,起始索引为(25,25)的位置开始复制一块大小为50x50的子区域到目标GMEM):src GMEM pointer : d

2009-12-30 07:23:00 4028

原创 CUDA数值计算:多重网格算法的实现

   昨天抽时间写了个多重网格法求解泊松方程的程序,同样,还是先传上程序,文章的话以后补上。可以在:http://download.csdn.net/source/1830421下载到

2009-11-19 21:13:00 2140 1

原创 不定

  昨晚闲暇时突然间就又想去了她,忍不住发了条短信给她,她正在离开北京的火车上。相互几个来回却发现自己已经“不敢”再如过往那样用“放肆”的语气对她讲话了,虽然是隔着文字在千里以外的空间,自己还是显的很拘谨,甚至心理有些许的小心,文字仿佛也有了声音,必须轻拿轻放,生怕哪句话再伤害她。这个隔阂也许永远甚至也没有机会再冰释,又禁不住的后悔当初的谎言把自己囚禁在无所适从的地步,以至于感觉自己没有了去想念的

2009-09-13 12:23:00 845 2

原创 战斗的乐章再次响起

  最近重复看了几遍圣斗士星矢之>,制作的确很精良,故事更充实了,其内涵也更加深邃了。不过可能因为这部作品是少女漫画家,多少让这部热血作品多了点暧昧的脂粉气,也由此而衍生出很多“萌迷”。还是很喜欢这部作品的画风的,尤其喜欢片尾曲〈花之锁〉,最近一直再听。越听越有味道,开头和末尾的那段音乐也真是超棒。从神话时代开始的传说,儿时如梦般的回忆在这重新开启的圣战中再次点燃那久违的冲动。不过动画速度太慢了,

2009-09-06 02:49:00 912

原创 那段感情飘到了世界的尽头

   说过不喜欢纠缠不清的,还是无法忘记,但2天前彻底斩断了那仅有的已经变的暗淡的羁绊,连同心中一直自做多情的祈望。她已经重新找到了自己的归宿,虽然我们之间可能永远都不会再见面,甚至在最后那一刻决裂的短信发出后,我才发现自己竟然吝啬的没有给她一句祝福。希望她过的开心,毕竟她曾经是我想为之努力并契之以认可的。呵呵,我一定会忘记她的。从此以后我们双方的世界中不会再有对方的任何存在的关联。  极力的

2009-06-21 10:49:00 1262 2

原创 基于D3Q19模型的LBM流体模拟

在CUDA上实现基于D3Q19模型的LBM流体模拟方法简介--cyrosly与2009.05.14下午 LBM(Lattice Boltzmann Model)方法简介:  LBM是始与上世纪80年代末起源于70年代的LGA(格子气自动机)理论模型,并最终从90年代初开始趋于成熟(在适定的范围内)的一种流体计算的介观方法(处于微观与宏观之间),从本质上讲,它比N-S方程的描述更

2009-05-14 00:06:00 16671 20

原创 哎,原来如此

  时至今日才知道自己的无能与堕落.但我不会去抱怨任何,那改变不了什么,要怪只能怪自己的无知与可笑.是该好好反省的时候了.我要让自己的意志跟随着阳光同行

2009-05-04 20:45:00 951 2

原创 指边愁

  这几天不知不觉间抽的烟数量明显增加,今天更是几乎3包烟,肺麻麻的貌似也在隐隐做痛.这在我当初接触它之前的一段时间之后几乎再没有过的事情.可是愁并没有随着一支接一支的烟弥散开去,思绪也一片混乱.在敲打以及即将结束这篇文字时,一紊的烟仍然在我指边缭绕.记得曾经看过一个冷笑话:抽烟的人必须具备的三个特点,香烟,打火机以及抽烟时无耻的神韵.其实我并不喜欢自己的心脏跳动在阴影中......

2009-05-02 01:39:00 936 1

原创 模糊的记忆

  突然间感觉我们之间的距离越来越远,也没有过的陌生.自始至终我都在矛盾中苦恼,很多时候想要尽快忘记,不再为她神伤,也不会再有对过去怀念中的依恋,想来如果这样或许也会觉自己在感情上并没有男人不应该有的矫情和理还乱.可又总是怕哪天记不起她的脸,抓不住她的轮廓也感觉不到她曾经留在我心中的隐涩.那时会是怎样的心情,我自己也不无法预料.  忘记一个人真的可以从过去中解脱吗?也许吧.事实上我讨厌与别人纠

2009-04-30 22:13:00 743

原创 没有方向

    最近感情和事业都一塌糊涂,甚至不知道自己该去往何方.也许注定要颓废.但我不甘心,也决不认输.我一定会,一定会改变,改变所有以往对自己的不认同.因为我喜欢撒满阳光的天空.

2009-04-28 00:27:00 713

原创 谨以此文纪念我一段逝去的感情

   已经过了很久(也许只是感觉很久而已),虽然时常会想起她,但我相信时间会抹平所有记忆的褶皱.这段时间也一直被一些事情困饶,虽然失落容易让人在孤独时更加喜欢思念,但我还是不愿意去想.本来以为时间和空间的距离会慢慢的阻隔我们之间的过去,互相淡忘掉对方.但是昨天她意外的短信还是让我有一种说不出的苦涩.我甚至不知道该说些什么,感觉一片混乱.对于她,我只能装做若无其事再加少许冷漠的伪装.我不愿意对她承认

2009-04-25 23:41:00 1215

原创 Volume Compute In SIMT Hardware Architecture

--转载请注明出处     在进行基于体数据的PDE计算时,总是会涉及到邻接单元(neighbir cell)的访问,想要提高计算效率就必须尽量共享邻域数据,减少访问全局内存的次数.不同于二维的情况,尤其是需要多次迭代计算时,三维纹理的效率很多时候差强人意,且需要在下一步迭代开始前进行大量数据的复制操作.而如果用二维纹理,cache命中率让人不敢恭维,且同样需要内存复制操作.虽然线型层

2009-04-13 14:41:00 1761 3

原创 Geometry Shader简明教程

[code]int main(int argc,char** argv){glutInit(&argc,argv);glutInitWindowPosition(256,128);glutInitWindowSize(512,512);glutCreateWindow("OpenGL geometry shader demo");GLenum err;//初始化GLEW以及确定

2007-10-01 17:21:00 3254

用CUDA实现多重网格算法

用多重网格方法求解泊松方程,使用V循环,dirichlet边界条件,但是很容易扩展为其他如nuemann边界条件,因为我将内点和边界点分别使用不同的内核进行处理。另外dirichlet在我的程序中虽然使用的是零边值条件,但是程序本身的设计是按照任何边界值实施的。

2009-11-19

CUDA矩阵向量乘法

高效的矩阵向量乘法程序,用两中方法实现,其中第二种比第一种方法大约快了一倍,但都比CPU快多了。测试尺寸2000x4000

2009-11-06

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除