并行计算
文章平均质量分 74
小颀
这个作者很懒,什么都没留下…
展开
-
CUDA3--矩阵乘法,利用共享存储器
http://www.cnblogs.com/Romi/archive/2012/05/17/2506826.html 上篇的方法是在全局存储区中,这样对取数据时速度回很慢,影响性能,而设备中线程对块中的共享存储区中数据读取时速度是很快的,并且在全局存储区中进行读取时,有很多数组元素的重复读取。因此,先将需要计算的数组数据读取到共享存储区中,再利用共享存储区中的数据进行计算,就会提高性转载 2012-12-15 22:06:51 · 364 阅读 · 0 评论 -
CUDA ---2 分支控制,变量
Control Flow Opteration:Instruction cycle for anthimetic aritinstruction:Fetch | Decode | Execute | Memory control Divergence Exampls---Example with divergence:IF (threadIdx.x >2) {}1. T原创 2012-12-15 21:46:31 · 414 阅读 · 0 评论 -
CUDA --1 基础知识
初学CUDA,做个笔记,鞭策自己。 CUDA--Compute Unified Device Architecture(统一计算设备架构)thread: 并行基本单位thread block: 互相合作的线程组Grid: 一组thread blockKernel:在GPU上执行的核心程序one kernel one gridSPA-streaming process原创 2012-12-15 18:58:18 · 430 阅读 · 0 评论