自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Augusdi的专栏

攀登技术的高峰,我与大家共勉!

  • 博客(165)
  • 资源 (5899)
  • 收藏
  • 关注

转载 CUDA和OpenCL全解释

Khronos组织最近规范了OpenCL 1.0, OpenCL实际上是针对异构系统进行并行编程的一个全新的API,简单来说OpenCL它可以利用GPU,然后进行一些并行计算这方面的工作,这是API应用程序的编程接口,图形里面也有很多API,比如OpenGL那是针对图形的,OpenCL是针对并行计算的API。OpenCL开发人员可以利用GPU和CPU的计算能力,把GPU和CPU异构的系统运用在很多

2013-09-30 23:43:12 2291

转载 CUDA下的GPU编程--线程和变量

CUDA的线程是多维的,启动一个线程格,线程格可以是多维的,线程格中分为线程块,线程块也可以是多维的,线程块中包含线程,对于GPU来说,同时启动200万个线程是很轻易的事情。blockIdx :当前执行设备代码的线程块的索引dim3 grid(DIM,DIM):声明一个二维的线程格,名字为grid;kernel>(dev_t):线程块为一个二维线程块,每个线程块有一个线程gridDim:保存线程格

2013-09-30 23:41:13 2232

转载 CUDA的OpenCV-2.3.x/OpenCV-2.4.x编译

版权声明:对于本博客所有原创文章,允许个人、教育和非商业目的使用,但务必保证文章的完整性且不作任何修改地以超链接形式注明原始作者、出处及本声明。    博客地址:http://blog.csdn.net/shuxiao9058    原始作者:季亚    前面,我们讲到了使用OpenCV-2.4.0在Visual Studio 2005/2008/2010常规编译的方法,本文则主要讲述如何使Ope

2013-09-30 23:35:54 2666

转载 CUDA 与 OpenCL 区别

根据网站资料,简单地汇编一下CUDA与OpenCL的区别。如有错误请指出。题外话: 美国Sandia国家实验室一项模拟测试证明:由于存储机制和内存带宽的限制,16核、32核甚至64核处理器对于超级计算机来说,不仅不能带来性能提升,甚至可能导致效率的大幅度下降。什么是OpenCL?是由苹果(Apple)公司发起,业界众多著名厂商共同制作的面向异构系统通用目的并行编程的开放式、免费标准,也是一个统一的

2013-09-30 23:32:52 2645

转载 CUDA和OpenCV实现的图像GAMMA变换

一个很简单的CUDA程序,适合刚刚接触CUDA的人了解CUDA的工作原理,以及与OpenCV结合的基本用法。#include #include #include #include #include "cutil_inline.h"#define GAMMA 0.4void runTest(int argc, char** argv);__global__ v

2013-09-30 23:30:04 3499 1

转载 CUDA实现 全局光照中辐射度(Radiosity)算法

http://blog.csdn.net/BugRunner/article/details/5366692  1. 简介辐射度算法是一种经典的全局光照算法,它可以解决光线跟踪等直接照明方法中所不能表现的真实世界中的照明现象问题。虽然渲染的结果表现力强,但是问题之一就是算法的耗费较大,由于其原理就是对各个多边形面片进行着色,而且常常需要较多的迭代次数才能达到比较理想的效果,因此算法原理虽然比较简单

2013-09-30 23:28:01 3669

转载 CUDA任意维度的矩阵相乘

__global__ void matrixMul( float* A, float* B, float* C, int hA,int wA, int wB){int bx = blockIdx.x;int by = blockIdx.y;int tx = threadIdx.x;int ty = threadIdx.y;float Csub = 0.0f;

2013-09-30 23:23:49 4664

转载 CUDA和OpenCL

源地址:http://www.qingran.net/2011/07/cuda%e5%92%8copencl/作者:夏清然虽然我们可以使用已有的图形API来调用GPU,但是通过前文的分析,这个过程冗长且复杂。严重违反了程序员的优雅、和lazy原则。需要去学习图形学的一些知识,了解texture、shader等图形学专用概念,而且需要学习CGSL或者HLSL等shader着色语言。而且还要熟悉Ope

2013-09-30 23:22:56 2943

转载 CUDA 深入浅出谈

CUDA 深入浅出谈          “CUDA 是 NVIDIA 的 GPGPU 模型,它使用 C 语言为基础,可以直接以大多数人熟悉的 C 语言,写出在显示芯片上执行的程序,而不需要去学习特定的显示芯片的指令或是特殊的结构。”         “CUDA 是 NVIDIA 的 GPGPU 模型,它使用 C 语言为基础,可以直接以大多数人熟悉的 C 语言,写出在显示芯片上执行的程序,而不需要去

2013-09-30 23:12:31 7904

转载 深入浅出谈CUDA

深入浅出谈CUDA2009-2-5 作者: he21he21 来源: he21he21关键字: CUDA NVIDIA   CUDA是什么?能吃吗?  编者注:NVIDIA的GeFoce8800GTX发布后,它的通用计算架构CUDA经过一年多的推广后,现在已经在有相当多的论文发表,在商业应用软件等方面也初步出现了视频编解码、金融、地质勘探、科学计算等领域的产品,是时候让我们对其作更深一步的了解。为

2013-09-30 23:04:11 2234

转载 CUDA写显卡内存的FFT问题。

今天尝试用cuda把FFT实现,遇到了难题。直接调用cufft库的话,内存拷贝与数据处理的时间比大约是1:2。但是据说cufft并不是最高效的,所以想自己锻炼一下。 我的思路是将二维的每一行映射到一个block,每个点都是一个thread。先将数据拷贝到显卡全局内存,然后拷贝到每个block的共享内存,这是因为读取global memory会占用更多的指令周期。然后就是处理这段shared mem

2013-09-30 22:51:52 3558

转载 CUDA的配置与入门

开始接触CUDA,我安装好后完全不知道怎么运行demo,当然也没有见到详细的安装说明。下面说说我的经验。Platform:Win XP64IDE:VS20081 获取可访问以下网址:http://www.nvidia.com/object/cuda_get.html共需下载3个应用程序,分别是:1>     CUDA Driver2>     CUDA Toolkit3>     CUDA SDK

2013-09-30 22:48:04 7125

转载 CUDA函数前缀与存储器前缀讨论

转自:http://space.itpub.net/?uid-23172605-action-viewspace-itemid-627164在CUDA C语言对C语言的扩展之一就是加入了一些函数前缀和存储器前缀,它们是:函数前缀:__device__ , __global__, __host__存储器类型前缀:__device__, __shared__, __constant__(constan

2013-09-30 20:46:58 2002

转载 CUDA笔记

CPU代码作用:在kernel启动前进行数据准备和设备初始化的工作,以及在kernel之间进行的一些串行运算。理想状况下 ,CPU串行代码的作用只是清理上一个kernel函数,并启动下一个kernel函数。       CUDA并行计算函数kernel:它是整个CUDA程序中的一个可以被并行执行的步骤。       kernel函数中存在两个层面的并行:Grid中的block间并行;block中的

2013-09-30 20:33:45 2353

转载 OpenCV: 实现将三幅图像合并在一张图片

*****************/#include #include int main(){ char* filePath ="D:/图片库/Lena.jpg"; IplImage* srcImg = cvLoadImage(filePath); IplImage* greyImg = cvCreateImage(cvGetSize(srcImg),

2013-09-30 20:09:59 6543 1

转载 CUDA之VS2010中配置CUDA5.0

原文地址:http://blog.csdn.net/diyoosjtu/article/details/84542531、安装之前必须确认自己电脑的GPU支持CUDA。在设备管理器中找到显示适配器(Display adapters),找到自己电脑的显卡型号,如果包含在http://www.nvidia.com/object/cuda_gpus.html的列表中,说明支持CUDA。安装CUDA之前最

2013-09-30 19:45:43 2033

转载 CUDA中__threadfence()的含义与理解

在CUDA里面,不同线程间的数据读写会彼此影响,这种影响的作用效果根据不同的线程组织单位和不同的读写对象是不同。在不考虑2.x的优化的情况下,(1)在同一个warp内的线程读写shared/global,  读写global和shared是立刻对本warp内的其他线程立刻可见的。(2)在同一个block内的不同warp内线程读写shared/global,    这种读写必须使用__syncthr

2013-09-30 19:40:41 3445

转载 CUDA开发环境配置大全

原文地址:http://cudazone.nvidia.cn/forum/forum.php?mod=viewthread&tid=3735一、操作系统:(1)windows操作系统:1.windows xp:(1)       win32_xp_ CUDA3.0_VS2010_配置指南-DOC:http://cudabbs.it168.com/forum.php?mod=viewthread&t

2013-09-30 19:38:38 3399

转载 VS2010配置CUDA5.0

1.安装CUDAhttp://blog.csdn.net/mrzhufeng/article/details/91865152.VS创建控制台空项目Properties--->VC++ Directories 设置头文件目录和库目录Linker---->Input加入lib3.选择编译环境选中工程,Project--->Build Customization4.新建.cu文件选择CUDA C/C+

2013-09-30 19:37:37 2727

转载 CUDA的Threading:Block和Grid设定

硬件基本架构  实际上在 nVidia 的 GPU 里,最基本的处理单元是所谓的 SP(Streaming Processor),而一颗 nVidia 的 GPU 里,会有非常多的 SP 可以同时做计算;而数个 SP 会在附加一些其他单元,一起组成一个 SM(Streaming Multiprocessor)。几个 SM 则会在组成所谓的 TPC(Texture Processing Cluste

2013-09-30 19:33:34 2332

转载 CUDA在VS2010下5.5设置

在开始学习之前,首先要做的就是找到一本好的教材,要知道一本好的教材可以让我们更加轻松地入门。在看了一些个CUDA编程相关的教材之后,我向大家推荐的一本教材叫做《GPU高性能编程CUDA实战》。本教材相比其他的教材而言,它讲得比较细,对于一些我们可能不太明白的知识点做了详细的说明。而且这本教材以层层深入的方式向我们展示了GPU的世界,从而引领我们进入CUDA编程的大门。其他的教材的话我建议的是《深入

2013-09-30 19:32:46 7622 2

转载 CUDA优化

1. memory coalescing,保证内存融合。因为global memory在CC为1.x上是按照half wrap进行访问读写的,而在2.x上是按照wrap进行访问读写的。在显存中,有多个存储器控制器,负责对显存的读写,因此,一定要注意存储器控制器的负载均衡问题。每一个存储器控制器所控制的那片显存中的地址空间称为一个分区。连续的256Byte数据位于同一个分区,相邻的另一组256Byt

2013-09-30 19:23:31 2298

转载 CUDA: 通过九个步骤实现在VS2010中加载CUDA 3.2

说明 本文主要通过图片,外加一些文字进行说明。   通过本文,希望你初步学会使用 nVidia CUDA SDK v3.2 ,  享受GPU 编程带给你的乐趣。学会使用 CUDA ,你就可以在使用了 nVidia 显卡的机子上进行 GPU编程了。 相关资料   用 CUDA sdk编写的程序,相关的文件结尾一般是 *.cu ,这些程序一般称之为 kernels 。 一个 kernel 就是一个结构

2013-09-30 19:22:23 2524

转载 CUDA之Hello World

1.  Cuda 编程环境的搭建:    网上针对不同的操作系统和cuda版本有很多详细的安装说明,推荐使用安装Cuda VS Wizard,下载地址http://sourceforge.net/projects/cudavswizard/。 2.  第一个Cuda程序:    新建项目,选择CUDA—CUDAWinAPP—输入项目名称—确定。其中一个自动生成的文件叫sample.cu,这是环境自

2013-09-30 19:10:25 4795

转载 CUDA中的一些概念和提示

1.在用vs运行cuda的一些例子时,在编译阶段会报出很多警告:     warning C4819 ......    解决这个警告的方法是打开出现warning的文件,Ctrl+A全选,然后在文件菜单:file->Advanced save options,在弹出的选项中选择新的编码方式为:UNICODE- codepage 1200 ,点确定后重新编译。   为什么会出现这个警告呢?原因在于

2013-09-30 19:03:43 3608

原创 CUDA内存整理

函数类型__device__  标记的函数从一个在器件中执行的函数呼叫,在器件中执行  __global__  表示该函数从一个在主机中执行的函数呼叫,在器件中执行__host__     表示在主机中呼叫,在主机中执行的函数 线程grid里面包含block,block里面包含threadgrid里面所有的block都是同样大小的,每个block最多可以有1024个thread。blockDim表

2013-09-30 19:00:57 1989

转载 CUDA: 理解CUDA

1. 理解GPU为了提升运算能力,大家更喜欢用 “更多的、简单的计算单元”CPU解决的问题是Latency,每个任务最短能在多长时间内完成GPU解决的是ThroughPut,每个单位时间能解决多少任务GPU擅长高效的并发并行的执行大量的线程2. CUDA计算模型3. 典型的GPU程序CPU为GPU分配内存空间     CUDA MALLOCCPU拷贝输入数据 CPU->GPU     CUDA m

2013-09-30 18:03:35 5392

转载 CUDA存储器模型

CUDA存储器模型:GPU片内:register,shared memory;板载显存:local memory,constant memory, texture memory, texture memory,global memory;host 内存: host memory, pinned memory. register: 访问延迟极低;              基本单元:register

2013-09-30 11:24:16 1719

转载 CUDA编程基础

CUDA编程模型CUDA编程模型将CPU作为主机,GPU作为协处理器(co-processor)或设备。在这个模型中,CPU负责逻辑性强的事务处理和串行计算,GPU则专注于高度线程化的并行处理任务。CPU、GPU各自拥有相互独立的存储器地址空间。一旦确定了程序中的并行部分,就可以考虑把这部分计算工作交给GPU。kernel:运行在GPU上的C函数称为kernel。一个kernel函数并不是一个完整

2013-09-30 11:19:24 1477 1

转载 CUDA统计时间

原文地址:CUDA 统计时间作者:handsomefriend转载:http://blog.csdn.net/jdhanhua/article/details/4843653使用cutil.h中的函数unsigned int timer=0;//创建计时器cutCreateTimer(&timer);//开始计时cutStartTimer(timer);{  //统计的代码段  …………}//停止

2013-09-30 11:15:47 1586

转载 CUDA的初始化

http://www.cnblogs.com/dflower/archive/2009/10/16/1584827.html    首先介绍一下开发环境,Visual Studio 2008 + CUDA Wizard for Visual Studio. 确保显卡支持CUDA(GeForce 8系列之后,否则只能用模拟模式)并安装CUDA DDK及CUDA Toolkit。    安装完CUDA

2013-09-30 11:03:40 3332

转载 CUDA的BLAS数学库

刚刚从C++博客迁徙过来,原来的那么多东西要拷贝要粘贴图片要重新上传真是累。看过的朋友可不要骂小弟灌水注:本文的代码图片资料选自NVIDIA CUDAProgramming Guide,原作者保留所有著作权。  NVIDIA近日终于发布了CUDA,有可能作为下一代SDK10的一部分奉送给乐于发掘GPU计算能力的专业人员。感兴趣的朋友可以去这里一探究竟,下载尝鲜,提供了大量的范例。  我们都知道,G

2013-09-30 10:46:30 10149 1

转载 CUDA编程

http://www.cnblogs.com/stewart/archive/2013/01/05/2846860.html目录:1.什么是CUDA2.为什么要用到CUDA3.CUDA环境搭建4.第一个CUDA程序5. CUDA编程5.1. 基本概念5.2. 线程层次结构5.3. 存储器层次结构5.4. 运行时API5.4.1. 初始化5.4.2. 设备管理5.4.3. 存储器管理5.4.3.1.

2013-09-30 10:41:22 6373

转载 CUDA内存拷贝

http://www.cnblogs.com/traceorigin/archive/2013/04/12/3016568.htmlCUDA内存拷贝1、cudaMemcpy() cudaMalloc()  //线性内存拷贝1 //线性内存拷贝2 cudaMalloc((void**)&dev_A, data_size);3 cudaMemcpy(dev_A, host_A, data_size

2013-09-30 10:38:03 13780

转载 CUDA数组分配

http://www.cnblogs.com/traceorigin/archive/2013/04/12/3016540.htmlcuda内存分配真是乱啊,这次总结一下数组的分配。概述:数组分配可以通过cudaMallocArray()和cudaMalloc3DArray()1、cudaMallocArray()cudaError_t cudaMallocArray ( struct

2013-09-30 10:37:13 3648

转载 CUDA 纹理内存

http://www.cnblogs.com/traceorigin/archive/2013/04/11/3015755.html1、概述  纹理存储器中的数据以一维、二维或者三维数组的形式存储在显存中,可以通过缓存加速访问,并且可以声明大小比常数存储器要大的多。  在kernel中访问纹理存储器的操作称为纹理拾取(texture fetching)。将显存中的数据与纹理参照系关联的操作,称为将

2013-09-30 10:36:34 10434

转载 CUDA线性内存分配

http://www.cnblogs.com/traceorigin/archive/2013/04/11/3015554.html概述:线性存储器可以通过cudaMalloc()、cudaMallocPitch()和cudaMalloc3D()分配1、1D线性内存分配1 cudaMalloc(void**,int) //在设备端分配内存2 cudaMemcpy(void* dest,vo

2013-09-30 10:35:40 5739 1

转载 CUDA内存类型memory

http://www.cnblogs.com/traceorigin/archive/2013/04/11/3015482.htmlCUDA存储器类型:每个线程拥有自己的register and loacal memory;每个线程块拥有一块shared memory;所有线程都可以访问global memory;还有,可以被所有线程访问的只读存储器:constant memory and tex

2013-09-30 10:34:47 14398 1

转载 C++ AMP: 遇见C++ AMP:GPU的线程模型和内存模型

遇见C++ AMP:GPU的线程模型和内存模型 Written by Allen Lee I don't care where the enemies are / Can't be stopped / All I know / Go hard– Linkin Park, Lost In The Echo C++ AMP、CUDA和OpenCL,选择哪个?      在《遇见C++ AMP:在GPU

2013-09-25 17:02:29 2767

转载 C++AMP: 遇见C++ AMP:在GPU上做并行计算

遇见C++ AMP:在GPU上做并行计算 Written by Allen Lee I see all the young believers, your target audience. I see all the old deceivers; we all just sing their song.– Marilyn Manson, Target Audience (Narcissus Nar

2013-09-25 16:35:26 11999

linux 视频教程PPT

linux 视频教程PPT

2015-01-17

CentOS.5系统管理

CentOS.5系统管理

2015-01-17

网络测试命令讲解

网络测试命令讲解

2015-01-17

Linux编辑器及VIM初步

Linux编辑器及VIM初步

2015-01-17

Linux下寻求帮助

Linux下寻求帮助

2015-01-17

在职教育3g学院-lamp经典入门29linux磁盘分区详解

在职教育3g学院-lamp经典入门29linux磁盘分区详解

2015-01-17

在职教育3g学院-lamp经典入门04linux目录结构介绍

在职教育3g学院-lamp经典入门04linux目录结构介绍

2015-01-17

Linux应用与发展

Linux应用与发展

2015-01-17

数据结构 C++ 语言描述(中文版)

数据结构 C++ 语言描述(中文版

2015-01-11

qt-win-opensource-src-4.5.2-msvc-6.0

qt-win-opensource-src-4.5.2-msvc-6.0

2014-09-08

qt-win-noncommercial-msvc-3.2.1

qt-win-noncommercial-msvc-3.2.1 qt-win-noncommercial-msvc-3.2.1

2014-09-08

KDE 2_Qt编程宝典

KDE 2_Qt编程宝典

2014-09-07

[CentOS.5系统管理].梁如军.丛日权.周涛.扫描版

[CentOS.5系统管理].梁如军.丛日权.周涛.扫描版

2014-09-07

openqrm_cloud_howto_deploying_physical_windows_systems_on_centos_5.5

openqrm_cloud_howto_deploying_physical_windows_systems_on_centos_5.5

2014-09-07

MBoo2014播放器

MBoo2014播放器

2014-09-07

数值分析与算法-徐士良著-随书源程序

数值分析与算法-徐士良著-随书源程序

2014-09-06

数据结构算法与应用-C++语言描述

数据结构算法与应用-C++语言描述

2014-08-15

[揭秘系列-离散数学]Discrete.Mathematics.Demystified

[揭秘系列-离散数学]Discrete.Mathematics.Demystified

2014-08-15

2013考研基础阶段测试题及答案-计算机-数据结构

2013考研基础阶段测试题及答案-计算机-数据结构

2014-08-15

数据结构 C++ 版 (第2版) 王红梅等 扫描版

[数据结构 C++ 版 (第2版)] 王红梅等 扫描版

2014-08-15

linux查找及压缩

linux查找及压缩

2015-07-19

精通正则表达式-第三版.(美)佛瑞德.扫描版

精通正则表达式-第三版.(美)佛瑞德.扫描版

2015-07-01

精通正则表达式-第3版-中文版.(美)Jeffrey.E.F.Friedl

精通正则表达式-第3版-中文版.(美)Jeffrey.E.F.Friedl

2015-07-01

普通人的编辑利器——VIM

普通人的编辑利器——VIM_(for_windows)

2015-03-11

VIM高级技巧

VIM高级技巧

2015-03-11

linux下vim使用详解(高清)

linux下vim使用详解(高清)

2015-03-11

vim使用教程

vim使用教程

2015-02-09

vim+ctags+cscope

vim+ctags+cscope

2015-02-09

Vim高效编辑的七个习惯

Vim高效编辑的七个习惯

2015-02-09

Vim编辑器 VIM

Vim编辑器

2015-02-09

Linux下VI的使用

Linux下VI的使用

2015-02-09

Vim文件编辑命令

Vim文件编辑命令

2015-02-09

linux下vi使用

linux下vi使用

2015-02-09

功耗分析攻击研究及抗功耗分析攻击密码芯片设计

功耗分析攻击研究及抗功耗分析攻击密码芯片设计

2015-02-07

从RTL到GDSII_基于CPF的完整低功耗设计流程

从RTL到GDSII_基于CPF的完整低功耗设计流程

2015-02-07

YAKSOC芯片的物理设计研究

YAKSOC芯片的物理设计研究

2015-02-07

CIF和GDSII格式版图数据的直接转换

CIF和GDSII格式版图数据的直接转换

2015-02-07

linux 视频教程-gcc

linux 视频教程-gcc

2015-01-19

Linux高级程序_进程管理

Linux高级程序_进程管理

2015-01-17

Linux命令类库机制及常用命令_Shell命令机制

Linux命令类库机制及常用命令_Shell命令机制

2015-01-17

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除