![](https://img-blog.csdnimg.cn/20201014180756919.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
并行计算
文章平均质量分 74
小颀
这个作者很懒,什么都没留下…
展开
-
CUDA3--矩阵乘法,利用共享存储器
http://www.cnblogs.com/Romi/archive/2012/05/17/2506826.html 上篇的方法是在全局存储区中,这样对取数据时速度回很慢,影响性能,而设备中线程对块中的共享存储区中数据读取时速度是很快的,并且在全局存储区中进行读取时,有很多数组元素的重复读取。因此,先将需要计算的数组数据读取到共享存储区中,再利用共享存储区中的数据进行计算,就会提高性转载 2012-12-15 22:06:51 · 358 阅读 · 0 评论 -
CUDA ---2 分支控制,变量
Control Flow Opteration: Instruction cycle for anthimetic aritinstruction: Fetch | Decode | Execute | Memory control Divergence Exampls ---Example with divergence: IF (threadIdx.x >2) {} 1. T原创 2012-12-15 21:46:31 · 406 阅读 · 0 评论 -
CUDA --1 基础知识
初学CUDA,做个笔记,鞭策自己。 CUDA--Compute Unified Device Architecture(统一计算设备架构) thread: 并行基本单位 thread block: 互相合作的线程组 Grid: 一组thread block Kernel:在GPU上执行的核心程序 one kernel one grid SPA-streaming process原创 2012-12-15 18:58:18 · 419 阅读 · 0 评论