CUDA
__Sunny__
学习记录生活
展开
-
GPU&CUDA几个基本概念
本文介绍 GPU 和 CUDA 相关的几个基本概念:SP、SM、warp、thread、block 和 grid。其中 SP,SM,warp 是硬件(GPU hardware)概念,而 thread,block,grid 是软件(CUDA)概念。参考了以下几篇博客或文章: 1. http://www.myexception.cn/cuda/1929840.html 2. http://b原创 2017-02-28 17:09:44 · 4395 阅读 · 0 评论 -
线程网络的分配
转载自 从0开始学习《GPU高性能运算之CUDA》——25 GPU也不允许偏心并行的事情多了,我们作为 GPU 的指令分配者,不能偏心了——给甲做的事情多,而乙没事做,个么甲肯定不爽的来。所以,在 GPU 中,叫做线程网络的分配。转载 2017-03-06 16:05:07 · 2085 阅读 · 0 评论 -
CUDA 问题解决 —— CUDA+MPI出错:"mpi.h" No such file or directory
在CUDA源文件里使用MPI时,编译出错Makefile文件:CUDA_INSTALL_PATH = /usr/local/cuda-8.0MPI_INSTALL_PATH = /opt/intel/compilers_and_libraries_2017.0.098/linux/mpi/intel64NVCC = $(CUDA_INSTALL_PATH)/bin/nvccMPICC原创 2017-03-08 13:52:01 · 13973 阅读 · 3 评论 -
CUDA 问题解决 ——在 c 文件中调用 cu 文件中定义的函数失败
当在 C 源文件中调用 .cu 文件中定义的函数时,会出现undefined reference 的问题原因是: nvcc 编译器前端依据 C++语法规则处理 CUDA 源文件解决方法:在 .cu 文件中定义的函数前加上 extern "C" 即可,这样 nvcc 编译器就会按照 C 的编译规则来编译该函数了。原创 2017-03-08 13:35:48 · 2829 阅读 · 0 评论 -
CUDA系列学习(六) 从并行排序方法理解并行化思维——冒泡、归并、双调排序的GPU实现
转载自女神 —— Rachel-Zhang 的专栏http://blog.csdn.net/abcjennifer/article/details/47110991在第五讲中我们学习了GPU三个重要的基础并行算法: Reduce, Scan 和 Histogram,分析了 其作用与串并行实现方法。 在第六讲中,本文以冒泡排序 Bubble Sort、归并排序 Mer转载 2017-03-02 14:51:45 · 2923 阅读 · 0 评论 -
CUDA系列学习(四)Parallel Task类型 与 Memory Allocation
转载自女神 —— Rachel-Zhang的专栏http://blog.csdn.net/abcjennifer/article/details/43374009本文为CUDA系列学习第四讲,首先介绍了Parallel communication patterns的几种形式(map, gather, scatter, stencil, transpose), 然转载 2017-03-02 14:44:38 · 678 阅读 · 0 评论 -
CUDA系列学习(二)CUDA memory & variables - different memory and variable types
转载自女神 —— Rachel___Zhang 的专栏http://blog.csdn.net/abcjennifer/article/details/42528569本文来介绍CUDA的memory和变量存放,分为以下章节:(一)、CPU Memory 结构(二)、GPU Memory结构(三)、CUDA Context(四)、kern转载 2017-03-02 14:40:28 · 589 阅读 · 0 评论 -
CUDA系列学习(三)GPU设计与结构QA & coding练习
转载自女神 —— Rachel-Zhang的专栏http://blog.csdn.net/abcjennifer/article/details/42778711啥?你把CUDA系列学习(一),(二)都看完了还不知道為什麼要用GPU提速? 是啊。。经微博上的反馈我默默感觉到提出这样问题的小伙伴不在少数,但是更多小伙伴应该是看了(一)就感觉离自己太远所以赶紧撤粉跑转载 2017-03-02 14:42:25 · 479 阅读 · 0 评论 -
CUDA系列学习(五)GPU基础算法: Reduce, Scan, Histogram
转载自女神 —— Rachel-Zhang 的专栏http://blog.csdn.net/abcjennifer/article/details/43528407喵~不知不觉到了CUDA系列学习第五讲,前几讲中我们主要介绍了基础GPU中的软硬件结构,内存管理,task类型等;这一讲中我们将介绍3个基础的GPU算法:reduce,scan,histogram,它们在并行算法中非转载 2017-03-02 14:48:46 · 861 阅读 · 1 评论 -
CUDA系列学习(一)An Introduction to GPU and CUDA
转载自女神 —— Rachel___Zhang 的专栏http://blog.csdn.net/abcjennifer/article/details/42436727本文从软硬件层面讲一下CUDA的结构,应用,逻辑和接口。分为以下章节:(一)、GPU与CPU(二)、CUDA硬件层面(三)、CUDA安装(四)、CUDA 结构与接口转载 2017-03-02 14:37:40 · 634 阅读 · 0 评论 -
CUDA编程
本文简介了 CUDA 编程,参考文章 CUDA 编程允许程序执行在异构系统上,即 CPU 和 GPU(作为主机的协处理器),二者有各自的存储空间,并由 PCIe 总线区分开。原创 2017-03-02 14:17:41 · 932 阅读 · 0 评论 -
GPU 架构及 Pascal GPU
GPU 架构 NVIDIA 的 GPU 计算产品被称作 Tesla,这是从第一代针对 GPU 计算的 G80(Tesla 8,当时的 GPU 微架构也叫 Tesla)开始,NVIDIA 将传统微架构意义上的内核称作 streaming multiprocessor,简称 SM 或 SMX,SM 对来自并行运行的众多线程的指令进行创建、管理、调度和执行,而“内核”这个称呼则被 NVIDIA 用作 S原创 2017-02-28 17:12:45 · 2492 阅读 · 1 评论 -
nvidia显卡驱动与编译器版本的查询命令
转自 http://www.linuxdiyf.com/linux/16687.html1. 首先验证你是否有nvidia的显卡(http://developer.nvidia.com/cuda-gpus这个网站查看你是否有支持gpu的显卡):$ lspci | grep -i nvidia 2. 查看你的linux发行版本(主要是看是64位还是32位的):$ uname -...转载 2017-03-20 09:50:13 · 30898 阅读 · 0 评论