cuda
文章平均质量分 95
Adenialzz
Keep Learning.
展开
-
Pytorch自定义C++/CUDA扩展
Pytorch自定义C++/CUDA扩展翻译 2022-07-04 21:35:33 · 2485 阅读 · 2 评论 -
Pytorch导出onnx模型,C++转化为TensorRT并实现推理过程
Pytorch导出onnx模型,C++转化为TensorRT并实现推理过程原创 2022-06-26 17:55:38 · 6594 阅读 · 20 评论 -
精简CUDA教程——CUDA Runtime API
精简CUDA教程——CUDA Runtime APIRuntime API 概述环境图中可以看到,Runtime API 是基于 Driver API 之上开发的一套 API。之前提到过 Driver API 基本都是 cu 开头的,而Runtime API 基本都是以 cuda 开头的。Runtime API 的特点Runtime API 与 Driver API 最大的区别是懒加载 ,即在真正执行功能时才自动完成对应的动作,即:第一个 Runtime API 调用时,会自动进行原创 2022-04-29 17:11:10 · 5957 阅读 · 0 评论 -
CUDA编程入门极简教程
CUDA编程入门极简教程转自:CUDA编程入门极简教程作者:小小将前言2006年,NVIDIA公司发布了CUDA,CUDA是建立在NVIDIA的CPUs上的一个通用并行计算平台和编程模型,基于CUDA编程可以利用GPUs的并行计算引擎来更加高效地解决比较复杂的计算难题。近年来,GPU最成功的一个应用就是深度学习领域,基于GPU的并行计算已经成为训练深度学习模型的标配。目前,最新的CUDA版本为CUDA 9。GPU并不是一个独立运行的计算平台,而需要与CPU协同工作,可以看成是CPU的协处理器,转载 2022-04-27 12:25:58 · 15746 阅读 · 2 评论 -
精简CUDA教程——CUDA Driver API
精简CUDA教程——CUDA Driver APIDriver APIDriver API概述CUDA 的多级 APICUDA 的 API 有多级(下图),详细可参考:CUDA环境详解。CUDA Driver API 是 CUDA 与 GPU 沟通的驱动级底层 API。早期 CUDA 与 GPU 沟通都是直接通过 Driver API。cuCtxCreate() 等 cu 开头的基本都是 Driver API。我们熟悉的 nvidia-smi 命令就是调用的 Driver API。后来发觉 D原创 2022-04-23 00:13:16 · 2517 阅读 · 0 评论