![](https://img-blog.csdnimg.cn/20201014180756919.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
CUDA官方样例库之矩阵乘系列
文章平均质量分 96
酱爆猪肝面
我真的搞不懂——为什么“那兔”的头像csdn过不了。
展开
-
【代码笔记】CUDA官方样例库之矩阵乘matrixMul基础系列版本
矩阵乘(General Matrix-matrix Multiplication,GEMM)是一类很重要的应用,尤其是在大语言模型领域,其是注意力机制的热点。Nvidia官方库在0_Introduction部分包含了四个版本的矩阵乘:matrixMul、matrixMul_nvrtc、matrixMulDrv和matrixMulDynJIT。本文将以matrixMul为基础,逐步展开对系列各个版本矩阵乘的梳理。原创 2024-07-27 14:28:04 · 886 阅读 · 0 评论 -
【代码笔记】CUDA官方样例库 GEMM矩阵乘matrixMul
矩阵乘(General Matrix-matrix Multiplication,GEMM)是一类很重要的应用,尤其是在大语言模型领域,其是注意力机制的热点。本文以Nvidia的官方样例库的矩阵乘法matrixMul为例,进行基础CUDA矩阵乘法流程梳理。原创 2024-07-24 12:19:03 · 1005 阅读 · 0 评论