CUDA
AliceWanderAI
北邮自动化学院,研究方向:图像处理,机器学习
展开
-
link-register spilling
https://developer.download.nvidia.cn/CUDA/training/register_spilling.pdf原创 2020-11-17 10:35:19 · 386 阅读 · 0 评论 -
GPU优化之Bank 冲突
什么是bank?shared memory被划分成大小相同的模块,这些模块叫做bank。不同bank可以被同时读写,将shared memory如此划分,将使得shared memory的访存带宽大大增加。如果shared memory被划分成16个bank,那么它的访存带宽会比不划分bank时快16倍。shared memory的访存速度是仅次于register,而又比global memory快100多倍。bank 冲突同一个Warp中不同线程去访问shared memory中.原创 2020-11-12 12:06:16 · 2342 阅读 · 0 评论 -
GPU性能衡量指标
GPU加速优化之前,我们先看看GPU的性能衡量。FLOPS OccupancyFLOPS(Floating-point-operations-per-second)每秒浮点运算量,是衡量GPU硬件计算能力的指标。Occupancy占有率,每个SM的活动线程束(possible active warps)数量与实际的活动线程束(active warps)数量的比值。它是衡量CUDA硬件执行效率的指标。CUDA上的线程指令是串行执行的。因此,在某些warp被暂停或者阻塞的时候,启动另外.原创 2020-11-11 13:28:58 · 5000 阅读 · 0 评论 -
link_cuda
https://www.nvidia.cn/docs/IO/51635/NVIDIA_CUDA_Programming_Guide_1.1_chs.pdf原创 2020-10-28 19:38:27 · 294 阅读 · 0 评论 -
解读CUDA C Programming Guide 第三章第2节
本文简单解读第三章:Programming Interface.本书旨在介绍进行CUDA并行优化的C编程指导。共5章,内容分别是: Introduction Programming Model Programming Interface Hardware Implementation Performance Guidelines 本章主要内容包括: Compilation with NVCC CUDA C Runtime..原创 2020-10-25 15:04:15 · 256 阅读 · 0 评论 -
Improve Path within 100 days
Operating system Coding language: C++ Algorithms Sorting Data structures Mathematics Graphs Recursion System Design Linux CudaLeetcode: 5*100 day (1*easy+3*medium+1*hard)100天的学习提升计划,每半个月至少进行一次面试实战。待续。。。...原创 2020-10-14 20:58:13 · 217 阅读 · 0 评论 -
解读CUDA C Programming Guide 第三章第1节(共6节)(3/5)
本系列为《解读CUDA C Programming Guide》.本书旨在介绍进行CUDA并行优化的C编程指导。共5章,内容分别是:Introduction Programming Model Programming Interface Hardware Implementation Performance Guidelines本文简单解读第三章:Programming Inte...原创 2020-03-15 18:04:24 · 283 阅读 · 0 评论 -
解读CUDA C Programming Guide (2/5)
本系列为《解读CUDA C Programming Guide》.本书旨在介绍进行CUDA并行优化的C编程指导。共5章,内容分别是:Introduction Programming Model Programming Interface Hardware Implementation Performance Guidelines本文简单解读第二章:Programming M...原创 2020-03-12 16:22:43 · 307 阅读 · 0 评论 -
解读CUDA C Programming Guide (1/5)
本系列为《解读CUDA C Programming Guide》.本书旨在介绍进行CUDA并行优化的C编程指导。共5章,内容分别是:Introduction Programming Model Programming Interface Hardware Implementation Performance Guidelines本文简单解读第一章:Introduction....原创 2020-03-11 12:54:27 · 801 阅读 · 0 评论 -
CUDA C best practice guide
这个文档是什么?此书是帮助开发者更好利用NVIDIA CUDA GPU的一本手册。同时本书也可做参考书,不过建议未读过的人可先概览一遍。谁应该读此书?本书中的讨论使用的都是C 语言,因此C语言/C++开发者在学习过程中应该不会感到费劲。同时,书中提到了很多其他学习文档,均可免费从英伟达网站获取:http://developer.nvidia.com/cuda-downloads 。下...原创 2019-11-07 19:20:11 · 503 阅读 · 0 评论