- 博客(1)
- 资源 (2)
- 收藏
- 关注
原创 SIMD和多核心编程时的一些总结。
1 在计算过程中不涉及输出内存的数据时,应使用_mm*_stream_*(直接写入内存)代替_mm*_store_*,例如: for( i=0; i { ymm0=_mm256_load_pd(a+i); ymm1=_mm256_load_pd(b+i); ymm2=_mm256_add_pd(ymm0,ymm1); _mm256_stream_pd(
2012-09-25 16:14:06 3531
用CUDA实现多重网格算法
用多重网格方法求解泊松方程,使用V循环,dirichlet边界条件,但是很容易扩展为其他如nuemann边界条件,因为我将内点和边界点分别使用不同的内核进行处理。另外dirichlet在我的程序中虽然使用的是零边值条件,但是程序本身的设计是按照任何边界值实施的。
2009-11-19
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人