CUDA
Leo-Ma
积跬步,以求大谋
展开
-
Ubuntu16.04安装cuda及cudnn方法
Ubuntu16.04安装cuda及cudnn方法准备工作安装显卡驱动下载cuda下载cudnn安装cuda安装cudnn准备工作安装显卡驱动具体步骤可以参考我这篇文章Ubuntu 16.04安装nvidia显卡驱动下载cuda我下载的是cuda10.0,在官方网站上找到对应版本下载即可。下载完成之后,得到cuda_10.0.130_410.48_linux.run文件。下载cudnn我下载的是cudnn7.4.2,在官方网站上找到相应版本下载cuDNN Librarary for Lin原创 2020-07-20 21:26:44 · 3605 阅读 · 0 评论 -
CUDA by example Chapter11 多GPU系统上的CUDA C
多GPU系统上的CUDA C零拷贝主机内存通过零拷贝内存实现点积运算零拷贝内存的性能使用多个GPU零拷贝主机内存零拷贝主机内存是另一种固定内存,它也不能被CPU从物理内存交换出去或者重新定位。同时,这种内存除了可以用于主机与GPU之间的内存复制外,还可以在CUDA C核函数中直接访问这种类型的主机内存。由于这种内存不需要复制到GPU,因此也称为零拷贝内存。通过零拷贝内存实现点积运算1. 测...原创 2019-12-07 15:58:36 · 286 阅读 · 0 评论 -
Ubuntu 16.04安装nvidia显卡驱动
Ubuntu 16.04安装nvidia显卡驱动下载显卡对应版本的驱动升级ubuntu的内核版本1.安装kernel开发包2.下载内核安装文件3.安装内核文件4.查看当前内核版本安装Nvidia驱动1.屏蔽nouveau驱动2.安装驱动3.查看显卡驱动新刷的ubuntu16.04,如果是用显卡接口接到显示器上的时候,会发现显示像素很低,这是因为显卡驱动没有安装,本文记录一下我安装显卡驱动的过程。...原创 2019-09-21 17:03:01 · 3227 阅读 · 0 评论 -
CUDA by example Chapter10 流
流为什么要使用CUDA流页锁存主机内存CUDA流使用单个CUDA流使用多个CUDA流GPU工作调度机制高效地使用多个CUDA流为什么要使用CUDA流前面章节实现的GPU并行性都是把同一个任务分成可以并行执行的子任务,利用GPU中数量众多的cuda核来实现单个任务的并行性。而如果要实现任务并行性,就需要使用CUDA流来实现。页锁存主机内存1. 页锁存内存的概念及用途页所存内存也称为固定内...原创 2019-09-05 10:07:41 · 259 阅读 · 0 评论 -
CUDA by example Chapter9 原子性
原子性在CPU上计算直方图在GPU上计算直方图一些重要函数及技巧使用GPU全局内存原子操作计算直方图使用GPU共享内存原子操作计算直方图与在操作系统中的线程竞争相似,GPU编程各个线程之间也存在竞态条件,为了保证程序按照我们设计的逻辑运行,原子性操作必不可少。本章以计算直方图为例,说明在GPU上使用原子操作的方法。在CPU上计算直方图这是平凡的// 代码9.4.1在CPU上计算直方图/...原创 2019-09-03 16:52:29 · 201 阅读 · 0 评论 -
CUDA by example Chapter7 纹理内存
纹理内存纹理内存简介热传导模拟简单的传热模型代码中温度更新的计算GPU不使用纹理内存的热传导模拟计算GPU使用一维纹理内存的热传导模拟计算GPU使用二维纹理内存的热传导模拟计算纹理内存简介和常量内存一样,纹理内存是另一种类型的只读内存。纹理内存是专门为那些在内存访问模式中存在大量空间局部性的图形应用程序而设计的。假如在某个计算应用程序中,一个线程读取的位置与邻近线程读取的位置"非常接近",使用...原创 2019-09-02 17:06:23 · 496 阅读 · 0 评论 -
CUDA by example Chapter6 常量内存与事件
常量内存与事件常量内存光线跟踪在GPU上实现光线追踪通过常量内存来实现光线追踪使用事件来测量性能常量内存使用常量内存的原因:GPU中含有数量庞大的计算单元,因此性能瓶颈通常并不在于芯片的数学计算吞吐量,而是在于芯片的内存带宽。在某些情况下,使用常量内存可以显著减少内存通信量光线跟踪光信跟踪是从三维对象场景中生成二维图像的一种方式。将跟踪从像素中投射出的光线穿过场景,直到光线命中某个物体...原创 2019-09-02 15:33:32 · 420 阅读 · 1 评论 -
CUDA by example Chapter5 线程协作
线程协作并行线程块的分解使用线程实现GPU上的矢量求和并行线程块的分解使用线程实现GPU上的矢量求和原创 2019-09-01 20:23:57 · 328 阅读 · 1 评论 -
CUDA by example Chapter4 CUDA C并行编程
CUDA C 并行编程CPU矢量求和运算GPU矢量求和运算尖括号语法<<CPU矢量求和运算/*//代码4.2.1.1基于CPU的矢量求和运算//时间:2019.07.20*/#include "cuda_runtime.h"#include "device_launch_parameters.h"#include <iostream>#define N 1...原创 2019-07-24 16:53:11 · 298 阅读 · 0 评论 -
CUDA by example Chapter3 CUDA C简介
CUDA C简介CPU上的Hello WorldGPU上的Hello World__global__修饰符:向kernal()中传递参数cudaMalloc()函数:cudaFree()函数:cudaMemcpy()函数:查询设备信息cudaGetDeviceCount()函数:结构体cudaDevicePropcudaGetDeviceProperties()函数:设备属性的使用:选择一个符合条...原创 2019-07-24 12:57:56 · 279 阅读 · 0 评论 -
win10安装cuda10.0以及VS2013下的CUDA编程测试
win10安装cuda10.0以及VS2013下的CUDA编程测试安装CUDA 10.0安装cuDNN v7.6.0 for CUDA 10.0VS2013下CUDA编程测试新建一个空的Win32 控制台应用程序:生成依赖的配置配置管理器,添加x64:工程配置新建CUDA C/C++文件添加代码进行测试安装CUDA 10.0下载cuda10.0 for windows10, 下载完成之后,得到...原创 2019-06-08 20:07:42 · 7388 阅读 · 11 评论