自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Cyrosly的专栏

准备钻到袋鼠的袋子里重生,谁知她已经怀孕了

  • 博客(1)
  • 资源 (2)
  • 收藏
  • 关注

原创 CUDA4.0 inline PTX汇编程序开发( 0 )

内联PTX汇编具有如下形式:asm(“instop”:”type_symbolic”(or):”type_symbolic”(ir),..);asm(“instop”::”type_symbolic”(r));第二种形式是无输出操作格式,需要使用”::”指示符其中instop是指令操作type_symbolic是类型指示符(可选如下),分别对应与PTX中的数据类型:“h” .s16, .u16“r” .s32, .u32“l” .s64, .u64“f” .f32“d” .f64例如://c=a+bfloa

2011-03-05 12:12:00 2962 3

用CUDA实现多重网格算法

用多重网格方法求解泊松方程,使用V循环,dirichlet边界条件,但是很容易扩展为其他如nuemann边界条件,因为我将内点和边界点分别使用不同的内核进行处理。另外dirichlet在我的程序中虽然使用的是零边值条件,但是程序本身的设计是按照任何边界值实施的。

2009-11-19

CUDA矩阵向量乘法

高效的矩阵向量乘法程序,用两中方法实现,其中第二种比第一种方法大约快了一倍,但都比CPU快多了。测试尺寸2000x4000

2009-11-06

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除