![](https://img-blog.csdnimg.cn/2021051310353751.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
CUDA
文章平均质量分 91
CUDA编程相关
_ambition_
这个作者很懒,什么都没留下…
展开
-
《CUDA C编程权威指南》学习笔记 chap4-6
《CUDA C编程权威指南》示例代码下载第4章 全局内存4.1 CUDA内存模型概述1. 内存层次结构的优点CUDA编程模型能将内存层次结构更好地呈现给用户,能让我们显式地控制 它的行为。2. CUDA内存模型CUDA内存模型提出了多种可编程内存的类型: ·寄存器 ·共享内存 ·本地内存 ·常量内存 ·纹理内存 ·全局内存所有线程都可以访问全 局内存。所有线程都能访问的只读内存空间有:常量内存空间和纹理内存空间。全局内 存、常量内存和纹理内存空间有不同的用途。纹理内存为各种数据布局提供了不原创 2021-05-08 11:53:54 · 508 阅读 · 2 评论 -
CUDA中grid、block、thread、warp与SM、SP的关系
首先概括一下这几个概念。其中SM(Streaming Multiprocessor)和SP(streaming Processor)是硬件层次的,其中一个SM可以包含多个SP。thread是一个线程,多个thread组成一个线程块block,多个block又组成一个线程网格grid。 现在就说一下一个kenerl函数是怎么执行的。一个kernel程式会有一个grid,grid底下又有数个block,每个block...转载 2021-05-07 17:37:24 · 4165 阅读 · 0 评论 -
《CUDA C编程权威指南》学习笔记 chap1-3
第二章 CUDA编程模型2.1 CUDA编程模型概述内存管理GPU内存分配:cudaMalloccudaError_t cudaMalloc(void** devPtr, size_t size)该函数负责向设备分配一定字节的线性内存,并以devPtr的形式返回指向所分配内存 的指针。cudaMalloc与标准C语言中的malloc函数几乎一样,只是此函数在GPU的内存里分 配内存。通过充分保持与标准C语言运行库中的接口一致性,可以实现CUDA应用程序的 轻松接入。2. 主机和设备之间的原创 2021-04-27 22:15:38 · 693 阅读 · 2 评论