![](https://img-blog.csdnimg.cn/20201014180756930.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Cuda
文章平均质量分 59
nsq_ai
这个作者很懒,什么都没留下…
展开
-
06、cuda流
cuda中流分为默认流(空流)和非空流。原创 2024-01-18 17:15:00 · 420 阅读 · 0 评论 -
05、cuda 标准库
cuda标准库简单示例。原创 2024-01-18 17:13:06 · 440 阅读 · 0 评论 -
04、cuda reduce了解内存使用
从数组规约中了解内存使用情况1、从cpu计算到GPU计算,加快计算速度2、从全局内存、共享内存、动态共享内存、原子函数,不断加速计算和减少内存使用3、数组规约的加速示例4、进一步研究,还可以从线程束方面进行规约计算。原创 2024-01-18 17:06:25 · 368 阅读 · 0 评论 -
03、cuda矩阵转置了解内存使用
从矩阵转置的角度,了解全局内存和共享内存的运行如果编译器能够判断一个全局内存变量在整个核函数的范围都只可读,自动会用函数__ldg() 读取全局内存,从而对数据进行缓存,缓解非合并访问带来的影响。通常不能满足读取和写入都是合并的情况下,一般来说应当尽量做到合并地写入。一些架构下,需要显示使用函数__ldg()在矩阵转置问题中,对全局内存的读和写这两个操作,总有一个是合并的,一个是非合并的。利用共享内存可以改善全局内存的访问模式,使得对全局内存的读和写都是合并的。原创 2024-01-18 16:57:40 · 1379 阅读 · 0 评论 -
02、cuda常用语句
记录cuda 常用基本语句。原创 2024-01-18 16:51:39 · 375 阅读 · 0 评论 -
01、cuda基本概念
以下信息介绍来自樊哲勇的cuda书籍,仅自己学习记录GPU(graphics processing unit),图形处理器,俗称显卡,但并不是显卡,显卡中包含GPU。1)与CPU的区别CPU有更多晶体管,用于数据缓存和流程控制,只有少数几个逻辑计算单元,适合完成简单的逻辑计算GPU有数千个核心,适合大规模矩阵运算。常见的GPU系列:2)CPU+GPU 异构计算平台CPU:host ,主机GPU:device 设备3)计算性能浮点数运算峰值:内存带宽(显存)原创 2024-01-18 16:33:53 · 997 阅读 · 0 评论