CUDA高性能计算
文章平均质量分 93
包括笔者对CUDA体系结构的理解和一些常用的程序优化方法,并将笔者在工作过程中遇到的优化问题拆解成小案例进行分析学习
A晨的博客
算法工程师,许个愿望渡过35岁危机
展开
-
CUDA优化方案—stream的使用
CUDA优化——stream的使用一、stream是什么?二、stream编程1.引入库一、stream是什么?示例:pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。二、stream编程1.引入库要讲的内容,本文仅仅简单介绍了pandas的使用,而pandas提供了大量能使我们快速便捷地处理数据的函数和方法。...原创 2022-01-28 10:10:49 · 4803 阅读 · 1 评论 -
一篇文章理解CUDA架构、编程与进阶使用
一篇文章理解CUDA架构、编程与进阶使用一、CUDA架构二、CUDA编程基础1.矩阵加法2.矩阵乘法三、CUDA进阶——利用共享内存加速访存1.CUDA内存读写速度比较2.申请共享内存一、CUDA架构二、CUDA编程基础从矩阵加法和矩阵乘法来认识CUDA编程1.矩阵加法__global__void vecAddKernel(float* A_d, float* B_d, float* C_d, int n){ int i = threadIdx.x + blockDim.x * bl原创 2022-01-26 11:45:12 · 4773 阅读 · 0 评论 -
CUDA加速计算矩阵乘法&进阶玩法(共享内存)
CUDA共享内存使用(以矩阵乘法为例)一、基础版矩阵乘法二、改进版矩阵乘法(利用共享内存)三、代码实例原创 2022-01-25 20:00:47 · 5989 阅读 · 14 评论