CUDA实践
文章平均质量分 65
CUDA实践
timeshark
猫头鹰是我的好朋友~
展开
-
cuda环境安装--windows离线安装
1.下载离线安装包。NVIDIA的官网为www.nvidia.com,进入communities->developer zone->cuda zone->cuda toolkit 下载对应版本。2.双击,同意协议,下一步等,完成。3.进入C:\ProgramData\NVIDIA Corporation\CUDA Samples\v7.5,找到5_Simulations/nbody,用对应原创 2016-03-20 21:33:52 · 1717 阅读 · 0 评论 -
linux下C/C++程序简单调试
假设已经有Windows下调试程序的基础,要在linux下进行简单的程序调试,可以使用gdb(Linux下的一个调试工具)。前提是在编译的时候加上 -g选项。以下是常用命令使用方法和作用: file a.out //把要调试的程序a.out加载进来。file是把要调试的那个程序加载进来,a.out即要调试的程序名。b 112 //在程序的112行添加断点r //将程序跑起来原创 2016-04-06 16:01:01 · 711 阅读 · 0 评论 -
一个MEX程序示例
mex文件是由C或Fortran语言编写的源代码,经matlab编译器处理而产生的二进制文件。它可以被matlab解释器自动装载并执行的动态链接程序,类似windows下的dll文件。mex文件实现了C语言与matlab的接口,以下例子阐述该接口。#include "mex.h" #include double GetLogLike(int size, double* x, double原创 2016-04-12 16:57:50 · 608 阅读 · 0 评论 -
CUDA内核函数的连续执行
以下是两个连续的CUDA核函数衔接的一种思路:要完成的功能:1. 向量的计算computer(暂时以两向量求和为例);2. 对结果向量求和SUM。思路1:写1个计算的内核函数,中间结果保留,求和函数调用cublas。#include "cuda_runtime.h"#include "device_launch_parameters.h"#include "cublas_v2.h"原创 2016-04-19 23:17:31 · 1425 阅读 · 0 评论 -
利用curand的host API生成均匀分布的随机数
利用cuda生成随机数其实很简单,分为以下几步:1. 准备相应的内存(device端)2. 创建生成器3. 设置生成器的种子4. 调用对应均匀分布的生成函数5. 拷贝回主存(可选)。其中核心是234步,以下是一个简单的示例:#include #include "cuda_runtime.h"#include "device_launch_parameters.h"原创 2016-05-04 22:03:05 · 819 阅读 · 0 评论 -
CUDA的一些总结和体会
导论GPU怎么产生的,以及后续发生了哪些变化?实时、高清晰度的三维图形需要大量的计算,单纯的CPU无法满足这种需求。由于这种需求的推动,图形处理器(GPU)就逐渐演化成高并行度,多线程,拥有强大的计算能力和极高的存储器带宽的多核处理器。GPU和CPU的浮点计算能力差异的原因是:GPU是特别为计算密集,高并行度计算(如图像渲染)设计的,因此GPU将更多的晶体管用于数据计算而不是数据缓存和流程控制原创 2016-06-20 13:30:16 · 8142 阅读 · 0 评论