CUDA
文章平均质量分 56
yongwuzhijing800
工程师
展开
-
NVIDIA历史驱动下载
NVIDIA历史驱动下载1进入下载地址https://www.nvidia.cn/geforce/drivers/2按F12进入浏览器开发模式3在最下面输入下面内容,可以浏览200条历史驱动,可以更改200,想多少就多少,只要不超限制就可以SystemScanner.prototype.DriverSearch = function(psid, pfid, osID, langCode, whql, beta, dltype, numresults ) {numresults=200;this.s原创 2022-03-30 18:47:29 · 4719 阅读 · 0 评论 -
查看GPU计算能力
查看GPU计算能力官网https://en.wikipedia.org/wiki/CUDA#Supported_GPUsCompute capability (version) Micro- architecture GPUs GeForce Quadro, NVS Tesla Tegra, Jetson, DRIVE 1.0 Tesla G80 GeForce 8800 Ultra, GeForce 8800.原创 2021-01-11 22:49:03 · 7932 阅读 · 0 评论 -
RapidCFD OpenMPI的下载和安装
1. 下载OpenMPI在官网上下载最新版本的安装包,https://www.open-mpi.org/software/ompi/v1.8/downloads/openmpi-1.8.4.tar.gz2. 解压并进行配置tar -zxvf openmpi-1.8.4.tar.gzcd openmpi-1.8.4./configure --prefix="/usr/local/openmpi"注意最后一行是将其安装到 /usr/local/openmpi目录下,可以指定为其他目录,原创 2021-01-11 18:47:22 · 5829 阅读 · 0 评论 -
安装NVIDIA驱动出现: An NVIDIA kernel module ‘nvidia-drm‘
系统:Ubuntu18.04。在tty模式中正常安装NVIDIA驱动发现报错,报错信息如下:An NVIDIA kernel module 'nvidia-drm' appears to already be loaded in your kernel. This may be because it is in use (for example, by an X server, a CUDA program, or the NVIDIA Persistence Daemon), but this m原创 2021-01-08 13:20:38 · 12229 阅读 · 1 评论 -
Ubuntu18.04安装NVIDIA显卡
Ubuntu 18.04CUDA Toolkit 11.2 Downloads https://developer.nvidia.com/cuda-downloads?target_os=Linux&target_arch=x86_64&target_distro=Ubuntu&target_version=1804&target_type=runfilelocalUbuntu18.04驱动 https://www.nvidia.com/download/drive原创 2021-01-07 10:58:57 · 4390 阅读 · 0 评论 -
Ubuntu18.04显卡驱动及CUDA卸载
卸载前$ nvidia-smiThu Jan 7 09:31:08 2021 +-----------------------------------------------------------------------------+| NVIDIA-SMI 390.48 Driver Version: 390.48 ||-------------------------------+------------原创 2021-01-07 09:49:37 · 4620 阅读 · 4 评论 -
Ubuntu查看显卡硬件型号
$ ubuntu-drivers devices== /sys/devices/pci0000:00/0000:00:01.0/0000:01:00.0 ==modalias : pci:v000010DEd00001C03sv0000103Csd00008439bc03sc00i00vendor : NVIDIA Corporationmodel : GP106 [GeForce GTX 1060 6GB]driver : nvidia-driver-390 - distro n.原创 2021-01-07 09:25:41 · 7138 阅读 · 0 评论 -
CUDA 开发遇到问题
1. 运行超过2秒, 软件崩溃解决方案: 在注册表中添加变量 TdrLevel REG_DWORD 0x00000000(0)位置 注册表(regedit)-->计算机-->HKEY_LOCAL_MACHINE-->SYSTEM-->CurrentControlSet-->Control-->GraphicsDrivers 添加变量步骤:1. win+R2. 输入 r原创 2020-12-10 15:57:39 · 1271 阅读 · 0 评论 -
CUDA学习(四)初探
CUDA核函数与运行时参数核函数是GPU每个thread上运行的程序。必须通过__gloabl__函数类型限定符定义。形式如下:__global__ void kernel(param list){ }核函数只能在主机端调用,调用时必须申明执行参数。调用形式如下:ernelDg,Db, Ns, S>>>(param list);>>运算符内是核函数的执行参转载 2016-09-06 16:28:24 · 1040 阅读 · 1 评论 -
《GPU高性能编程CUDA实战》学习笔记(十二)
第12章 后记12.1 目标工具资源12.2 CUDA 工具1. CUDA工具箱(CUDA Toolkit)2. CUFFT(Fast Fourier Transform)快速傅里叶变换库3. CUBLAS(Linear Algebra Routine)线性代数函数库4. NVIDIA GPU Computing SDK 有GPU设计示例程序5. NV原创 2016-09-19 22:28:52 · 1303 阅读 · 0 评论 -
《GPU高性能编程CUDA实战》学习笔记(十一)
第11章 多GPU系统上的CUDA C“比在一个GPU上计算要更好的,只有在两个GPU上计算。”11.1 本章目标了解如何分配和使用零拷贝内存(Zero-Copy Memory);了解如何在同一个应用程序中使用多个GPU;了解如何分配和使用可移动的固定内存(Portable Pinned Memory)。11.2 零拷贝主机内存cudaHostAlloc() 传递参原创 2016-09-19 22:01:04 · 3575 阅读 · 0 评论 -
《GPU高性能编程CUDA实战》学习笔记(十)
第10章 流GPU上执行大规模数据并行计算性能高于cpu上执行,此外,NVIDIA 图形处理器还支持一种并行性(Parallelism)。这种并行性类似于cpu多线程应用程序中的任务并行性(Task Parallelism)。任务并行性是指并行执行两个或者多个不同的任务,而不是在大量数据上执行同一个任务。在并行环境中,任务可以是任意操作。如一个线程绘制GUI,另一个线程通过网络下原创 2016-09-19 14:18:59 · 3285 阅读 · 1 评论 -
《GPU高性能编程CUDA实战》学习笔记(九)
第9章 原子性在某些情况下,对于单线程应用程序来说非常简单的任务,或许使用大规模的并行架构实现却会变成一个复杂的问题。这里我们将在这些情况中使用特殊的原语从而确保安全地完成传统单线程应用程序中的简单任务。9.1 本章目标了解不同NVIDIA GPU的计算功能集。了解原子操作以及为什么需要使用它们。了解如何在CUDA C核函数中执行带有原子操作的运算。9.2 计算功能集原创 2016-09-15 19:59:19 · 4144 阅读 · 0 评论 -
《GPU高性能编程CUDA实战》学习笔记(一)
第一天读这本书,先将封面让大家看看吧这两张图好大啊,不过读者会更加清晰的看到作者信息,这样也不错。近年来英伟达在CUDA上float运算性能基本上已经超过了cpu,并且gpu(Graphics Procdss Unit)编程难度也接近cpu编程。NVIDIA GPU是基于CUDA架构而建成,gpu可以完成传统图形渲染和通用计算任务。cuda gpu编程需要使原创 2016-09-08 17:17:29 · 6489 阅读 · 0 评论 -
《GPU高性能编程CUDA实战》学习笔记(三)
第三章 第一段CUDA C代码+Host/Device3.1 第一个程序"Hello,World!"3.1.1 Hello,World!#include "../common/book.h"int main( void ) { printf( "Hello, World!\n" ); return 0;}当看到这段代码时,你肯定在怀疑本书是原创 2016-09-09 10:41:50 · 5457 阅读 · 2 评论 -
《GPU高性能编程CUDA实战》学习笔记(四)
第4章 CUDA C并行编程4.1 目标了解CUDA在实现并行是采用的一种重要方式。4.2 CUDA并行编程__global__ 修饰符并行执行设备核函数4.2.1 矢量求和运算两数组中对应元素两两相加,保存到第三个数组中,其实是一个矢量求和运算。1.基于CPU的矢量求和#ifndef __BOOK_H__#define __BOOK_H__#inc原创 2016-09-09 14:24:52 · 3182 阅读 · 1 评论 -
《GPU高性能编程CUDA实战》学习笔记(五)
第五章 线程协作5.1 目标了解CUDA C 中的线程了解不同线程之间的通信机制了解并行执行线程的同步机制5.2 并行线程块的分解add>>(dev_a, dev_b, dev_c);尖括号中:N---开启了N个线程块;1---每个线程块中创建1个线程。共启动的线程数量:N个线程块*1个线程/线程块 = N个并行线程5.2.1矢量求和,重新回顾本节完原创 2016-09-09 17:00:42 · 1781 阅读 · 0 评论 -
《GPU高性能编程CUDA实战》学习笔记(六)
第6章 常量内存与事件原创 2016-09-11 21:29:24 · 1555 阅读 · 0 评论 -
《GPU高性能编程CUDA实战》学习笔记(七)
第七章 纹理内存Texture Memory, 与常量内存一样,纹理内存是另一种只读内存,在特定的访问模式中,纹理内存同样能提升性能并减少内存流量。7.1 本章目标了解纹理内存的性能特性了解如何在CUDA C中使用一维纹理内存了解如何在CUDA C中使用二维纹理内存7.2 纹理内存简介虽然NVIDIA为OpenGL和DirectX等的渲染流水线都设计了纹理单元,但纹原创 2016-09-12 20:03:30 · 2714 阅读 · 2 评论 -
《GPU高性能编程CUDA实战》学习笔记(八)
第8章 图形互操作性GPU既执行渲染计算,又执行通用计算。。。CUDA C应用可以无缝地与OpenGL和DirectX这两种实时渲染API进行交互。本章中包含大量OpenGL和GLUT(OpenGL Utility Toolkit)代码,要有些思想准备。8.1 本章目标了解图形互操作性是什么,以及为什么需要使用它。了解如何设置某个CUDA设备的图形互操作性。了解如何在C原创 2016-09-13 15:14:23 · 5650 阅读 · 1 评论 -
CUDA学习(一)前传
在项目需求下,小王从今天开始接触CUDA编程,由于项目中算法过程运行时间比较长,为了项目能够更快更好的运行和发展,cuda或许是一个比较好的选择。在这里小王和大家分享一些学习过程,个人能力有限,出现错误请谅解,希望有读者关注,并提出一些宝贵的建议。原创 2016-09-05 14:39:07 · 970 阅读 · 0 评论 -
CUDA学习(二)上古时期的武器装备
CUDA(Compute Unified Devices Architecture)-----小王的笔记本比较low,没有NVIDIA显卡,不能运行cuda程序,但是通过侧面打听公司中有些同事已经安装了CUDA,小王就厚着脸皮向他们借用电脑学习CUDA,使用他们的装备,所以没有了CUDA安装过程,这部分可能后面会有补充。拿到电脑,第一件事是查看上古时期留下来的装备1. NVIDIA原创 2016-09-05 14:54:18 · 1228 阅读 · 0 评论 -
CUDA学习(三)拔出剑鞘
上一篇文章,小王是直接复制图片到编辑框中,经过审核后,不知道为什么图片全部消失了,这次小王采取上传图片的方式,希望图片不会再消失掉。言归正传,刚刚测试了同事安装的项目运行没有问题,现在需要我自己建立一个简单项目进行测量,先测量一个简单的加法吧。一 打开VS2010,文件-->新建-->项目,取名cudaAdd,点击“确定”按钮,如下图,二 运行,看看有没原创 2016-09-05 16:30:15 · 925 阅读 · 0 评论 -
《GPU高性能编程CUDA实战》学习笔记(二)
第二章: 下载软件+配置cuda c代码环境读过小王博客的都知道,小王现在使用的是同事电脑,暂时不需要安装cuda c编译环境,但是本书既然介绍到这里,那大家和我先大概了解一下吧。2.1开发环境支持cuda的图形处理器NVIDIA 设备驱动程序CUDA 开发工具箱标准C编译器2.2.1 支持cuda的图形处理器完全列表可参考 NVIDIA 网址 www.nvid原创 2016-09-09 10:04:15 · 2918 阅读 · 0 评论