- 博客(2)
- 收藏
- 关注
原创 《大规模并行处理器编程实战》笔记
前言这一篇文章主要是作为我在看完《大规模并行处理器编程实战》这本书之后的一个学习记录。有些内容因为我在上一篇博客已经记录过了,这一篇就不做记录了。第六章 性能优化6.1 更多关于线程执行的问题GPU调度的基本单位为warp,一般由32个thread组成。因为GPU的执行方式为SIMT(单指令多线程),也就是一条指令会被所有线程一起执行,等到这条指令被所有线程执行完,才执行下一条指令。所以如...
2019-09-28 14:33:39 1074
原创 CUDA编程指南5.0笔记
最近在学CUDA编程,看的是NVIDIA官方编程指南5.0的中文版。此博客作为自己的一个简单的学习记录,方便后面自己对CUDA的知识进行回顾。1.编程模型1.1内核// 定义内核__global void VecAdd(float* A, float* B, float* c) { int i = threadIdx.x; c[i] = A[i] + B[i];}in...
2019-09-11 22:14:23 2573
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人