CUDA
文章平均质量分 97
帅的发光发亮
冲冲冲!
展开
-
自己写的cuda函数和cublas和ispc的对比(均支持非方阵的计算)
预备知识因为cublas的数据存储是按照列优先的,而c/c++是按行存储的。行优先还是列优先首先了解“行优先”和“列优先”的知识,这两种方式在数学上的直观描述如下,给定如下矩阵:矩阵在逻辑上表达为2维的矩阵,M行K列,但存储到内存的时候都是按一维布局,其中按行优先存储和按列优先存储的差异如上图所示如上图所示,当矩阵按行优先存储然后又按相反的列优先读取的话,就会得到元矩阵转置的结果;同理适用于按列优先存储然后按行优先读取。例 cublasSgemm 函数cublasStatus_t cubl原创 2021-08-06 20:51:44 · 6750 阅读 · 2 评论 -
CUDA程序优化之数据传输
CUDA程序优化设备端和主机端的数据相互拷贝不同的内存分配/传输方式,传输效率有何不同?(1)常规方式传输:cudaMemcpy(2)高维矩阵传输:cudaMemcpy2D/cudaMalloc3D(3)异步传输:cudaMemcpyAsync / cudaMemcpy2DAsync / cudaMemcpy3DAsync(4)锁页内存(Page-locked)(5)零拷贝内存(Zero-Copy)(6)CUDA流的使用多个流的使用1) GPU的工作调度机制2) 高效的运用多个CUDA流CUDA C/C++原创 2021-06-19 16:02:20 · 14638 阅读 · 8 评论 -
CUDA快速入门讲解、硬件结构、软件程序!
CUDA(Compute Unified Device Architecture)的中文全称为计算统一设备架构。做图像视觉领域的同学多多少少都会接触到CUDA,毕竟要做性能速度优化,CUDA是个很重要的工具,CUDA是做视觉的同学难以绕过的一个坑,必须踩一踩才踏实。CUDA编程真的是入门容易精通难,具有计算机体系结构和C语言编程知识储备的同学上手CUDA编程应该难度不会很大。本文章将通过以下五个方面帮助大家比较全面地了解CUDA编程最重要的知识点,做到快速入门:文章目录1. GPU架构特点2. CUDA线原创 2020-10-28 23:57:37 · 18587 阅读 · 0 评论