![](https://img-blog.csdnimg.cn/20201014180756724.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
CUDA
Johnsonjjj
这个作者很懒,什么都没留下…
展开
-
CUDA编程指南5.0笔记
最近在学CUDA编程,看的是NVIDIA官方编程指南5.0的中文版。此博客作为自己的一个简单的学习记录,方便后面自己对CUDA的知识进行回顾。1.编程模型1.1内核// 定义内核__global void VecAdd(float* A, float* B, float* c) { int i = threadIdx.x; c[i] = A[i] + B[i];}in...原创 2019-09-11 22:14:23 · 2555 阅读 · 0 评论 -
《大规模并行处理器编程实战》笔记
前言这一篇文章主要是作为我在看完《大规模并行处理器编程实战》这本书之后的一个学习记录。有些内容因为我在上一篇博客已经记录过了,这一篇就不做记录了。第六章 性能优化6.1 更多关于线程执行的问题GPU调度的基本单位为warp,一般由32个thread组成。因为GPU的执行方式为SIMT(单指令多线程),也就是一条指令会被所有线程一起执行,等到这条指令被所有线程执行完,才执行下一条指令。所以如...原创 2019-09-28 14:33:39 · 1020 阅读 · 0 评论