![](https://img-blog.csdnimg.cn/20201014180756780.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
CUDA读书笔记
文章平均质量分 88
smartcat2010
这个作者很懒,什么都没留下…
展开
-
《Learning CUDA Programming》读书笔记(四)
Kernel执行,GPU和Host之间数据Copy,都是有CUDA Stream管理的;default stream似乎不能与其他stream并行执行;即其他stream都结束后,default stream才能开始执行,他结束后,其他stream才能开始执行;...原创 2020-04-30 08:50:51 · 426 阅读 · 3 评论 -
《Learning CUDA Programming》读书笔记(三)
CUDA occupancy:一般等于:Active Thread Blocks per Multiprocessor /Max Threads per Multiprocessor;分子是用户kernel和GPU硬件条件共同决定的,分母完全由GPU硬件条件决定;这个occupancy越高(越接近100%),则GPU的SM上驻留的(叫做active)threads就越多,(实际同时运行的...原创 2020-04-06 20:49:20 · 549 阅读 · 1 评论 -
《Learning CUDA Programming》读书笔记(二)
GPU编程常见性能瓶颈:原创 2020-04-06 08:55:52 · 378 阅读 · 0 评论 -
《Learning CUDA Programming》读书笔记(一)
GPU擅长执行可并行的代码(data-parallel),CPU用来执行其他队延迟敏感的代码;原创 2020-04-06 07:07:46 · 607 阅读 · 1 评论