- 博客(1)
- 资源 (2)
- 收藏
- 关注
原创 CUDA4.0 inline PTX汇编程序开发( 0 )
内联PTX汇编具有如下形式:asm(“instop”:”type_symbolic”(or):”type_symbolic”(ir),..);asm(“instop”::”type_symbolic”(r));第二种形式是无输出操作格式,需要使用”::”指示符其中instop是指令操作type_symbolic是类型指示符(可选如下),分别对应与PTX中的数据类型:“h” .s16, .u16“r” .s32, .u32“l” .s64, .u64“f” .f32“d” .f64例如://c=a+bfloa
2011-03-05 12:12:00 2962 3
用CUDA实现多重网格算法
用多重网格方法求解泊松方程,使用V循环,dirichlet边界条件,但是很容易扩展为其他如nuemann边界条件,因为我将内点和边界点分别使用不同的内核进行处理。另外dirichlet在我的程序中虽然使用的是零边值条件,但是程序本身的设计是按照任何边界值实施的。
2009-11-19
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人