CUDA编程
文章平均质量分 68
Simple_Bright&Man
这个作者很懒,什么都没留下…
展开
-
CUDA编程练习(十四) Thrust、CuBLAS、CuRAND和CuDNN
还是充满未知。万万不可放弃、不可过于急躁原创 2024-06-06 11:44:02 · 406 阅读 · 0 评论 -
CUDA编程练习(十三) 样本排序
脑子清楚着才能干活,效率有数倍之差。我先躺会儿。。。。原创 2024-06-05 21:07:12 · 406 阅读 · 0 评论 -
CUDA编程练习(十二) 双调归并排序
本想把样本排序一并写了。还是算了,想躺床上了。。。原创 2024-06-04 20:51:11 · 197 阅读 · 0 评论 -
CUDA编程练习(十一) 矩阵转置
加一篇,本篇不是很多原创 2024-06-04 13:44:28 · 638 阅读 · 0 评论 -
CUDA编程练习(十) 前缀和
今天说要写两篇就写两篇,必须给它调试通了,奥里给原创 2024-06-03 23:16:14 · 270 阅读 · 0 评论 -
CUDA编程练习(九) 归约
拖延症晚期,但是还有得救原创 2024-06-03 10:18:50 · 373 阅读 · 0 评论 -
CUDA编程练习(八) Nsight System使用与服务器连接
这篇文章内容不多,今天再加一篇。。。原创 2024-06-02 23:00:49 · 781 阅读 · 0 评论 -
CUDA编程练习(七) CUDA_GDB与VSCode的自带调试器
学软件操作是这样的,从头到尾透露着一种抽象,反直觉、低“人机工效”、暴击思维惯性还暴击我这个操作快于脑子的习惯原创 2024-06-01 17:52:04 · 477 阅读 · 0 评论 -
CUDA编程练习(六) 卷积
一天一杯咖啡就够了,前两天明显过载。本文实现了几种矩阵乘法,单通道的输入输出,加了步长因素原创 2024-05-31 16:50:11 · 1501 阅读 · 0 评论 -
CUDA编程练习(五) 排序
XX排序+归并还是好,避开了多block的同步问题也是,GPU设计出来多block同步个什么劲儿,多轮就多轮共存+循环版本可以搞一搞,提高排序的上限边界条件可以换成把数组变成对齐数组,这样也能提高效率明天搞卷积,样本排序什么的往后稍稍,排得头晕。原创 2024-05-30 21:55:40 · 557 阅读 · 0 评论 -
CUDA编程练习(四) 矩阵相乘
今日强度:高。今日情绪:高压。日满意度:一般。矩阵乘法的内容应该不止这么多,这些只是凭借记忆和理解,后续还需要补充。后面还有排序是个大坑没开原创 2024-05-29 17:59:46 · 1913 阅读 · 1 评论 -
CUDA编程练习(三) 向量内积
装VSCode和配置VSCode的过程请多使用GPT4o,我也不能确定一个固定的步骤,因为我知道,以后一定会该里面乱七八糟的json文件,现在能用就够了。。。原创 2024-05-28 22:28:55 · 332 阅读 · 0 评论 -
CUDA编程练习(二) 向量相加
同一天做的东西,是个开始,希望能坚持下去原创 2024-05-28 22:11:33 · 185 阅读 · 0 评论 -
CUDA编程练习(一) 环境创建
以后会按照个人学习进度进行更新。原创 2024-05-28 22:06:39 · 239 阅读 · 0 评论