![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
并行计算
lvxiangyu11
我是一只菜鸡
展开
-
并行计算—0—Windows下环境配置CUDA与Visual Studio2017
原料:1.Visual Studio2017(https://visualstudio.microsoft.com/zh-hans/downloads/)先装这个2.CUDA Toolkit 9.2(https://developer.nvidia.com/cuda-downloads)再装这个 用的是Windows10环境,Linux还不太熟练略去安装过程,使用win10的小...原创 2018-07-22 04:39:01 · 5893 阅读 · 6 评论 -
并行计算初步—1—用向量之和食用一个栗子
代码我都加上注释了,耐心看完就行了,23333。不是作者菜,是没耐心看完代码。作者就是菜!!/*这段代码由lvxiangyu11编写,转载请注明出处。https://blog.csdn.net/lvxiangyu11*/#include "cuda_runtime.h"#include "device_launch_parameters.h"#include <stdio....原创 2018-07-22 04:48:57 · 287 阅读 · 0 评论 -
OpenCL并行编程基础 第五章
GPU架构体系请参见相关文档。此处不赘述 5.1 并行线程组织OpenCL并行程序的基本并行执行单元式线程(即 计算机上能够独立调度的一段顺序执行的指令流,GPU上使用硬件调度)GPU的一个内核总是装备SIMD硬件,包括多个计算和内存处理流水线,支持多个线程同时执行,这些线程即波前(wavefront 又为warp(线程束——NVIDIA)),宽度(线程个数)为SIMD的宽度。NV...原创 2019-02-16 07:26:28 · 839 阅读 · 1 评论 -
OpenCL并行编程基础 第六章 OpenCL事件和队列
任务队列允许程序员通过编辑直接创建、管理和调度任务。队列中的命令按提交命令的顺序执行,队列中的吓一跳命令必须等待当前命令执行完后才能开始执行。不同命令队列的先后执行顺序得不到保证。6.1 命令、命令队列和事件命令队列保证FIFO:/* 启动顺序任务队列的代码*/cl_uint num_devices;cl_device_id devices[1];errNum = c...原创 2019-02-18 00:41:54 · 1301 阅读 · 0 评论 -
CUDA10.0 官方手册 阅读笔记 章二 CUDA编程模型
以下为本人读CUDA 10.0的programming guide的读书笔记,部分为直接翻译重点内容。2.1 kernel Kernel函数是CUDA C拓展了C,使用户可以通过定义C函数来编写CUDA函数。 与只执行一次的C函数不同,如果kernel执行N次,则它会被分配到N个不同的CUDA thread中。 kernel通过”__globa...原创 2019-02-23 15:13:15 · 653 阅读 · 0 评论 -
CUDA10.0 官方手册 章三 CUDA编程接口
(因为这章内容比较碎,不好提炼,大部分为原文翻译,人工翻译,不是机器翻译。抵制不负责任的机翻从你我做起!翻译不易,转载贴上出处。——630056108@qq.com)目录3.1 用NVCC编译3.1.1 编译工作流3.1.2 二进制兼容性3.1.3 PTX(线程并行执行能力)兼容性3.1.4 程序兼容性3.1.5 C/C++兼容性3.1.6 64位兼容性3.2 ...原创 2019-02-24 19:45:21 · 4165 阅读 · 5 评论 -
CDUA 图形学 Texture Reference 实验
下面是对Texture Reference的实验,代码改自 CUDA C PROGRAMMING GUIDE (PG-02829-001_v10.0 | October 2018) p54,因为这里比较贴近计算机图形学,故移到图形学中去。©版权所有!/* 下面是对CUDA的Texture Reference的实验,实验环境VS2017,CUDA 10,GTX 1060。 作者:...原创 2019-03-02 20:46:47 · 530 阅读 · 0 评论 -
CDUA 图形学 Surface Object实验
下面是对Surfance Object的实验,代码改自 CUDA C PROGRAMMING GUIDE (PG-02829-001_v10.0 | October 2018) p54,因为这里比较贴近计算机图形学,故移到图形学中去。©版权所有!/* 下面是对CUDA的surface object的实验,实验环境VS2017,CUDA 10,GTX 1060。 作者:吕翔宇,部...原创 2019-03-04 00:12:20 · 735 阅读 · 1 评论 -
CDUA 图形学 Surface Reference实验
下面是对Surfance Reference的实验,代码改自 CUDA C PROGRAMMING GUIDE (PG-02829-001_v10.0 | October 2018) p54,因为这里比较贴近计算机图形学,故移到图形学中去。©版权所有!/* 下面是对CUDA的Surface Reference的实验,实验环境VS2017,CUDA 10,GTX 1060 作者:...原创 2019-03-04 19:06:39 · 355 阅读 · 0 评论