GPU编程
文章平均质量分 79
Cyrosly
这个作者很懒,什么都没留下…
展开
-
Volume Compute In SIMT Hardware Architecture
--转载请注明出处 在进行基于体数据的PDE计算时,总是会涉及到邻接单元(neighbir cell)的访问,想要提高计算效率就必须尽量共享邻域数据,减少访问全局内存的次数.不同于二维的情况,尤其是需要多次迭代计算时,三维纹理的效率很多时候差强人意,且需要在下一步迭代开始前进行大量数据的复制操作.而如果用二维纹理,cache命中率让人不敢恭维,且同样需要内存复制操作.虽然线型层原创 2009-04-13 14:41:00 · 1744 阅读 · 3 评论 -
CUDA4.0 inline PTX汇编程序开发( 0 )
内联PTX汇编具有如下形式:asm(“instop”:”type_symbolic”(or):”type_symbolic”(ir),..);asm(“instop”::”type_symbolic”(r));第二种形式是无输出操作格式,需要使用”::”指示符其中instop是指令操作type_symbolic是类型指示符(可选如下),分别对应与PTX中的数据类型:“h” .s16, .u16“r” .s32, .u32“l” .s64, .u64“f” .f32“d” .f64例如://c=a+bfloa原创 2011-03-05 12:12:00 · 3028 阅读 · 3 评论 -
基于D3Q19模型的LBM流体模拟
在CUDA上实现基于D3Q19模型的LBM流体模拟方法简介--cyrosly与2009.05.14下午 LBM(Lattice Boltzmann Model)方法简介: LBM是始与上世纪80年代末起源于70年代的LGA(格子气自动机)理论模型,并最终从90年代初开始趋于成熟(在适定的范围内)的一种流体计算的介观方法(处于微观与宏观之间),从本质上讲,它比N-S方程的描述更原创 2009-05-14 00:06:00 · 16577 阅读 · 20 评论