Cuda入门教程
文章平均质量分 95
从0到1深入理解CUDA
发狂的小花
公众号:极空AI
AR行业经验、算法部署优化、图像处理算法、slam、SGBM、相机标定、TOF
CPU、DSP、GPU、算子针对硬件优化
展开
-
深度学习神经网络训练环境配置以及演示
深度学习神经网络训练环境配置以及演示原创 2024-03-15 16:30:26 · 1487 阅读 · 0 评论 -
CUDA Profiling的安装配置使用(nvvp nvprof nsight)
nvpp nprof nsight的安装配置使用,在Ubuntu18上原创 2024-03-13 00:41:05 · 1443 阅读 · 0 评论 -
CUDA环境配置在Ubuntu18
NVIDIA CUDA 环境配置在Ubuntu18上原创 2024-03-12 09:30:00 · 2470 阅读 · 0 评论 -
CUDA入门之统一内存
借助 CUDA 6,NVIDIA 引入了 CUDA 平台历史上最引人注目的编程模型改进之一,即统一内存。在当今典型的 PC 或集群节点中,CPU 和 GPU 的内存在物理上是不同的,并由 PCI-Express 总线分开。在 CUDA 6 之前,程序员就是这样看待事物的。CPU 和 GPU 之间共享的数据必须在两个内存中分配,并由程序在它们之间显式复制。这给 CUDA 程序增加了很多复杂性。原创 2024-03-11 17:10:05 · 1086 阅读 · 0 评论 -
CUDA基本入门教程
GPU并不是一个独立运行的计算平台,而需要与CPU协同工作,可以看成是CPU的协处理器,因此当我们在说GPU并行计算时,其实是指的基于CPU+GPU的异构计算架构。在异构计算架构中,GPU与CPU通过PCIe总线连接在一起来协同工作,CPU所在位置称为为主机端(host),而GPU所在位置称为设备端(device)原创 2024-03-10 23:25:05 · 1676 阅读 · 0 评论