CUDA学习日记
NYG8945
并行计算初学者
展开
-
GPU高性能编程CUDA实战中的book.h
/* * Copyright 1993-2010 NVIDIA Corporation. All rights reserved. * * NVIDIA Corporation and its licensors retain all intellectual property and * proprietary rights in and to this software and rel原创 2016-10-22 10:57:27 · 1701 阅读 · 0 评论 -
用NVIDIV Visual Profiler 进行分析执行效果
先附上代码,这是上次进行多线程运算的程序。 不同的是最后多了行代码: cudaThreadExit(); //加上这个可以用 NVIDIA visual profiler进行分析 这行代码是保证分析时进行判断是否运行完的,不然分析软件一直会在分析GPU的运行状态,产生无用的垃圾信息。下面是要分析的多线程程序//GPGPU编程技术-从GLSL、CUDA到OpenCL 平方和算法第一版 增加计原创 2016-10-29 13:52:08 · 1528 阅读 · 0 评论 -
增加计时函数 GPGPU编程技术-从GLSL、CUDA到OpenCL 平方和算法第一版
在本函数中增加了计时的功能,需要time.h库函数已经在头文件中添加。//GPGPU编程技术-从GLSL、CUDA到OpenCL 平方和算法第一版 增加计时函数//书中程序160页#include <stdio.h>#include <iostream>#include <cuda_runtime.h> // For the CUDA runtime routines (prefixed原创 2016-10-25 23:20:31 · 905 阅读 · 0 评论 -
并行计算分类
并行计算分类原创 2016-10-13 18:39:20 · 1837 阅读 · 0 评论 -
第一个CUDA程序
第一个CUDA程序/*** addition: C = A + B.** This sample is a very basic sample that implements element by element* vector addition. It is the same as the sample illustrating Chapter 2* of the programming gui原创 2016-10-13 17:02:42 · 342 阅读 · 0 评论 -
GPGPU编程技术-从GLSL、CUDA到OpenCL 平方和算法第一版 书中程序158页
//GPGPU编程技术-从GLSL、CUDA到OpenCL 平方和算法第一版//书中程序158页#include <stdio.h>#include <iostream>#include <cuda_runtime.h> // For the CUDA runtime routines (prefixed with "cuda_")#include <DEVICE_LAUNCH_PARA原创 2016-10-23 11:49:31 · 807 阅读 · 0 评论 -
CUDA矩阵加法
实现矩阵相加 有可能相关库没有加载上 请自行加载#include <stdio.h>#define N 1024#define TPB 16__global__ void MatAdd(int A[N][N], int B[N][N], int C[N][N]){ int i = blockIdx.x * blockDim.x + threadIdx.x; int j = bl原创 2016-10-20 16:11:29 · 2497 阅读 · 0 评论 -
检测GPU属性
本代码可以检测设备属性int main(void){ cudaDeviceProp prop; int count; cudaGetDeviceCount(&count); printf("cuda device count: %d\n", count); for (int i = 0; i < count; ++i) {原创 2016-10-20 16:06:28 · 567 阅读 · 0 评论 -
CUDA一维线程
自己敲的第一个并行计算程序/**实现线程的显示*/#include <stdio.h>#include <iostream>#include <cuda_runtime.h> // For the CUDA runtime routines (prefixed with "cuda_")#include <DEVICE_LAUNCH_PARAMETERS.h> //我在查询中找到的头文件 有可能有原创 2016-10-18 18:03:36 · 605 阅读 · 0 评论 -
多线程CUDA实例 167页 平方求和
//GPGPU编程技术-从GLSL、CUDA到OpenCL 平方和算法第二版 增加计时函数 没有为主机变量分配内存 多线程求和////书中程序167页#include <stdio.h>#include <iostream>#include <cuda_runtime.h> // For the CUDA runtime routines (prefixed with "cuda_")#原创 2016-10-28 23:17:16 · 844 阅读 · 0 评论 -
GPGPU编程技术-从GLSL、CUDA到OpenCL 平方和算法第三版
//GPGPU编程技术-从GLSL、CUDA到OpenCL 平方和算法第三版 增加计时函数 ////书中程序168页#include <stdio.h>#include <iostream>#include <cuda_runtime.h> // For the CUDA runtime routines (prefixed with "cuda_")#include <device_原创 2016-11-02 22:26:58 · 2548 阅读 · 0 评论 -
CUDA的内存结构,通过实例展示寄存器和共享内存的使用
本章将介绍CUDA的内存结构,通过实例展示寄存器和共享内存的使用。CUDA内存结构GPU的内存结构和CPU类似,但也存在一些区别,GPU的内存中可读写的有:寄存器(registers)、Local memory、共享内存(shared memory)和全局内存(global memory),只读的有:常量内存(constant memory)和纹理内存(texture memory)。CUDA To转载 2016-10-20 16:23:49 · 2979 阅读 · 0 评论