![](https://img-blog.csdnimg.cn/20201014180756922.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
CUDA
全幼儿园最阔爱
这个作者很懒,什么都没留下…
展开
-
VS2105+CUDA9.1配置
必须先安装所要应用的Microsoft Visual Studio环境,然后再安装CUDA(根据显卡所支持的CUDA版本进行安装,同时vs也支持此cuda版本)。当新建项目中出现NVIDIA CUDA x.x(版本号)时,表明CUDA已成功安装。配置Microsoft Visual Studio2.1 项目建立成功后,解决方案,右键–>属性–>通用属性–>调试源文件–>包含源代码的目录:C:\Program Files\NVIDIA GPU Computing Toolki.原创 2020-09-06 14:53:06 · 304 阅读 · 0 评论 -
CUDA——线程束分化
#include <stdio.h>#include <cuda_runtime.h>#include "device_launch_parameters.h"#include <stdlib.h>#include <time.h>// kernel1__global__ void mathKernel1(float *c){...原创 2019-11-25 21:46:10 · 1548 阅读 · 2 评论 -
CUDA检查块和线程索引
1. 组织并行线程 对于一个给定的线程, 首先可以通过把线程和块索引映射到矩阵坐标上来获取线程块和线程索引的全局内存偏移量, 然后将这些矩阵坐标映射到全局内存的存储单元中。 第一步, 可以用以下公式把线程和块索引映射到矩阵坐标上: ix = threadIdx.x + blockDim.x*blockIdx.x; iy = threadIdx.y + bloc...原创 2019-11-25 13:54:36 · 517 阅读 · 0 评论 -
CUDA实现矩阵加法
前言本文通过一个矩阵加法的例子来说明如何使用网格和块来组织线程。使用块和线程建立矩阵索引通常情况下,一个矩阵用行优先的方法在全局内存中进行线性存储。如下图所示,这是一个8*6的矩阵。在一个矩阵加法和核函数中,一个线程通常被分配一个数据元素来处理。首先要使用块和线程索引从全局内存中访问指定的数据。 接下来学习需要管理3种索引:线程和块索引;矩阵中给定点的坐标;全局线性内存中的偏移量...原创 2019-05-11 20:53:22 · 3687 阅读 · 6 评论 -
CUDA使用运行时API查询设备信息
1. 在CUDA运行时API中有很多函数可以帮助管理这些设备,使用这些运行时API查询设备信息,代码如下:#include <stdio.h>#include <stdlib.h>#include <cuda_runtime.h>#include <math.h>#define EXIT_FAULLURE -1#define EX...原创 2019-05-10 23:04:42 · 733 阅读 · 0 评论