Nvidia <cuda programming guide>文章转载
CUDA官方文档转接
参考cuda toolkit documentation
一、简介
GPU将更多晶体管用于数据计算,而CPU将更多晶体管用于流管理。
GPU通过用计算掩盖访存延迟,而CPU采用大容量的cache和复杂的流处理。
1.1 可扩展编程模型
利用多核处理器如GPU的编程面临的问题是:如何透明地利用日益增长的核数。
cuda提供了一个简单的编程模型,而又能解决上述问题的方法。
核心分为三个关键抽象:
线程组织层级结构。
共享内存。
阻碍同步。
保留了线程协作的表达性,但是提
翻译
2021-05-12 15:08:17 ·
468 阅读 ·
0 评论