cuda
文章平均质量分 59
CHAOS万有引力
这个作者很懒,什么都没留下…
展开
-
《cuda by example》 book.h 头文件解析
cpu_bitmap.h 头函数解析 blog.csdn.net/ghost129/article/details/4409565都是一些函数,等用到的时候再过来解析,哈哈!#ifndef __BOOK_H__#define __BOOK_H__#include /* cuda检错程序 */static原创 2012-11-26 21:15:05 · 6049 阅读 · 0 评论 -
CUDA函数库调用问题解决
问题:装好CUDA5.5, samples也安装成功,编译也成功了,但是在运行程序的时候出问题了。譬如进入NVIDIA_CUDA-5.5_Samples/7_CUDALibraries/ 目录中,执行 ./conjugateGradientPrecond 结果报错了,居然报错了:./conjugateGradientPrecond: error while loading shar原创 2013-09-26 13:59:22 · 6074 阅读 · 0 评论 -
CUDA samples 2.3节 用CUDA示例来创建CUDA项目
2.3.1. Creating CUDA Projects for Windows略2.3.2默认的samples的安装路径 是 NVIDIA_CUDA_5.5_Samples 并且示例程式的分为六类 : 0_Simple,1_Utilities, 2_Graphics, 3_Imaging, 4_Finance, 5_Simulations,6_Advanced, 7_CUDALi翻译 2013-09-16 17:18:35 · 3255 阅读 · 0 评论 -
CUDA samples 第三章 sample reference 概况
示例代码分为下列几类:1. Simple Reference 基础CUDA示例,适用于初学者, 反应了运用CUDA和CUDA runtime APIs的一些基本概念.2. Utilities Reference 演示如何查询设备能力和衡量GPU/CPU 带宽的实例程序。 3. Graphics Reference 图翻译 2013-09-16 18:23:22 · 3612 阅读 · 0 评论 -
CUSparse 第二章 使用CUSPARSE API
2.1 2.1 线程安全 这个库是线程安全的,并且函数可以被多个主机线程调用。2.2 标量参数 标量参数可以在主机和设备之间传递。 极少数函数的返回值是标量,譬如doti()和nnz().和其他返回数据类型一样,标量参数返回时要等到GPU上运作完成才能确定。所以当主机读取数据时应当要做适当的同步。 这个特点允许CUSPARAE函数翻译 2013-09-12 02:38:20 · 2393 阅读 · 0 评论 -
CUSPARSE 第三章 CUSPARAE索引和数据格式
(纯属自学笔记,部分翻译,不会翻译的不翻译)3.1 索引基本格式 该函数库支持 zero- and one-based 索引. The index base 是通过 cusparseIndexBase_t 选择, 且是一个独立参数,或者是矩阵形容器 cusparseMatDescr_t type的一部分3.2 向量格式 略3.3 矩阵格式 略翻译 2013-09-13 11:45:20 · 1571 阅读 · 0 评论 -
CuSparse 第一章
(部分翻译)第一章 介绍 1. 命名惯例 CUSPARSE 包含了一系列处理稀疏矩阵的基本的线性代数子程式。是cuda函数库的一部分,从C,C++中调用。 该库例程可以分为四类: 第一层:在稠密向量格式和稀疏矩阵向量格式之间的操作 第二层:在稀疏矩阵格式和稠密向量格式之间的操作翻译 2013-09-11 23:36:39 · 3974 阅读 · 0 评论 -
cuda 细节提要
double类型若使用double的数据类型,自己编译一下程序,你会发现warning : Double is not supported. Demoting to float。但是如果你在编译时候自己加上-arch sm_13,有些gpu是支持double的。原创 2013-08-06 10:02:14 · 997 阅读 · 0 评论 -
CUDA by Example 第三章 部分翻译实践 GPU器件参数提取
由于这本书内容实在是多,很多内容和其他讲解cuda的书又重复了,所以我只翻译一些重点,时间就是金钱嘛,一起来学cuda吧。如有错误,欢迎纠正由于第一章第二章暂时没时间仔细看,我们从第三章开始不喜欢受制于人,所以不用它的头文件,所有程序我都会改写,有些程序实在是太无聊,就算了。//hello.cu#include#includeint main( void )翻译 2013-04-05 19:41:13 · 2802 阅读 · 0 评论 -
《Programming Massively Parallel Processors》Chapter5 习题解答
<!--@page {margin:0.79in}p {margin-bottom:0.08in}-->自己做的部分习题解答,因为时间关系,有些马虎,也不全面,欢迎探讨或指出错误5.1 Consider the matrixaddition in Exercise 3.1. Can one use shared memory to reduce原创 2013-07-04 11:02:08 · 2812 阅读 · 0 评论 -
thread block grid
grid里面包含block,block里面包含threadgrid里面所有的block都是同样大小的, 每个block最多可以有1024个thread。blockDim表示一个block里面thread的数量。block里面每个thread都有一个独一无二的编号,threadIdx参考文献:《programming massively parallel pro原创 2013-07-04 10:43:11 · 1172 阅读 · 0 评论 -
__device__ __global__ __host__
__device__ 标记的函数从一个在器件中执行的函数呼叫,在器件中执行 __global__ 表示该函数从一个在主机中执行的函数呼叫,在器件中执行__host__表示在主机中呼叫,在主机中执行的函数翻译 2013-07-04 10:58:27 · 3809 阅读 · 0 评论 -
CUDA Memories--CUDA记忆体(翻译+整理+测试)
一边学习一边记录(本文中英结合,专业名词统统不翻译) 在CUDA里,host和devices有不同的记忆体空间。 首先呢,CUDA的memory有很多种类啦 1. Global memory 2. Constant memory 这两种memory可以由CPU上运行的函数呼叫读写。 Global memory 这个,学过一翻译 2013-07-01 15:35:20 · 1477 阅读 · 0 评论 -
cuda4.0编程指南 读书摘要
本篇实际为方便自己写程序的时候索引。不需要的请绕过。 1. threadIdx -----P7 2. threadsPerBlock -----P8 3. blockIdx , blockDim -----P9 4. syncthreads 同步 ----P10 5.cuda原创 2013-03-11 20:01:36 · 1188 阅读 · 0 评论 -
CUDA by Example 4.2.2 一个有趣的例子 之 #include "gl_helper.h"
参考链接:http://code.google.com/p/snp-gpgpu/source/browse/trunk/f/common/gl_helper.h?r=4/*看不懂头两行和最后一行是做什么事情的时候,参考 http://blog.csdn.net/fulva/article/details/8208312 */#ifndef __GL_HELPER_H__#defi翻译 2012-11-21 16:45:22 · 3644 阅读 · 0 评论 -
GPU与CPU性能比较
以下是参考2009年出版的书比较的,不要忘了时代在进步哦1、线程 CPU 一个核心通常在一个时刻只能运行一个线程指令,CPU的多线程机制通过操作系统提供的API实现,是一种软件粗粒度多线程。当一个线程中断,或者等待某种资源时,操作系统就保存当前线程的上下文,并装载另外一个线程的上下原创 2012-11-20 20:42:58 · 4691 阅读 · 0 评论 -
并行计算种类---读书笔记
1、单核指令级并行(ILP) 让单个处理器的执行单元可以同时执行多条指令。现代CPU的每个核心都采用了超标量、超级流水线、超长指令字、SIMD、超线程、分支预测等手段发掘程序内的指令级并行。2、多核并行(multi-core) 在一个芯片上集成多个处理器核心,实现线程级并行(TLP)。CPU上多线程的编程原创 2012-11-20 17:59:58 · 1889 阅读 · 0 评论 -
CUDA by Example 4.2.2 一个有趣的例子之 CPU_bitmap.h解析
在《CUDA by Example》4.2.2中有一个很有趣的例子,里面用到了两个头文件,由于我里面的代码实在看不懂,咱就先来研究一下这段代码的头文件吧. 这篇主要讲的是 CPU_bitmap.h 这个头文件,在这个头文件里还包含了一个头文件,欲知详情,请参看:http://blog.csdn.net/fulva/article/details/8208229,gl_helper.原创 2012-11-26 20:54:15 · 5727 阅读 · 0 评论 -
Ubuntu12.04 cuda5.5安装
预处理步骤: 首先确认你的电脑装了一个可以运行CUDA程序的GPU。lspci | grep -i nvidia另外要确认linux版本和gcc版本具体参考链接:http://docs.nvidia.com/cuda/cuda-getting-started-guide-for-linux/index.html下载Nvdia Toolkit 下载链接:http://原创 2013-09-16 14:12:18 · 6186 阅读 · 2 评论