Augusdi的专栏

攀登技术的高峰,我与大家共勉!

NVIDIA正式宣布CUDA 6.0:支持统一寻址!

NVIDIA于2013-12-27正式宣布了最新版并行计算开发工具CUDA 6,相比此前的CUDA 5.5有着革命性的巨大进步。NVIDIA表示,CUDA 6可以让并行编程前所未有的轻松,能够显著节省开发人员的时间和精力,而通过GPU加速可带来最多8倍于CPU模式的性能提升。CUDA 6的关键新特...

2014-02-27 10:05:32

阅读数 2946

评论数 2

CUDA从入门到精通

CUDA从入门到精通(零):写在前面 在老板的要求下,本博主从2012年上高性能计算课程开始接触CUDA编程,随后将该技术应用到了实际项目中,使处理程序加速超过1K,可见基于图形显示器的并行计算对于追求速度的应用来说无疑是一个理想的选择。还有不到一年毕业,怕是毕业后这些技术也就随毕业而去,准备这个...

2013-10-17 11:22:30

阅读数 151191

评论数 33

OpenCV: OpenCV中GPU模块使用

CUDA基本使用方法 在介绍OpenCV中GPU模块使用之前,先回顾下CUDA的一般使用方法,其基本步骤如下:1.主机代码执行;2.传输数据到GPU;3.确定grid,block大小;4.调用内核函数,GPU运行程序;5.传输结果到CPU;6.继续主机代码执行。下图是两个向量相加的简单示例程序和处...

2013-10-15 16:28:05

阅读数 3216

评论数 0

CUDA中模板的使用

模板是C++的一个重要特征,它可以让我们简化代码,同时使代码更整洁。CUDA中也支持模板,这给我们编写cuda程序带来了方便。不过cuda4.0之前和之后使用模板的方法不一样,这给我们带来了少许困难。在cuda4.0之前,模板的使用和C++中无区别,使用非常方便,在此不做过多介绍。不过在cuda4...

2013-10-15 10:52:26

阅读数 2871

评论数 1

GPU通用计算调研报告

摘要:NVIDIA公司在1999年发布GeForce256时首先提出GPU(图形处理器)的概念,随后大量复杂的应用需求促使整个产业蓬勃发展至今。GPU在这十多年的演变过程中,我们看到GPU从最初帮助CPU分担几何吞吐量,到Shader(着色器)单元初具规模,然后出现Shader单元可编程性,到今天...

2013-10-15 10:43:38

阅读数 3853

评论数 0

双剑合璧:CPU+GPU异构计算完全解析

引用自:http://tech.sina.com.cn/mobile/n/2011-06-20/18371792199.shtml 这篇文章写的深入浅出,把异构计算的思想和行业趋势描述的非常清楚,难得一见的好文章。按捺不住转一下。^_^  相对于串行计算,并行计算可以划分成时间并行和空间并行。时间...

2013-10-15 10:16:14

阅读数 2993

评论数 0

CUDA: CUBLAS - hello cublas

/*=======================================================================* 度假中,在青岛这块曾经应该很熟悉的土地上,另一半在围着病人们转悠* 所以自己在酒店里,也不想出去,听听歌,写写文章。================...

2013-10-15 10:06:48

阅读数 3720

评论数 1

cudaMallocPitch()数组的使用

名称 cudaMallocPitch – 向GPU分配存储器概要 cudaError_t cudaMallocPitch( void** devPtr,size_t* pitch,size_t widthInBytes,size_t height )说明 向设备分配至少widthInBytes*h...

2013-10-15 09:52:36

阅读数 2107

评论数 0

CUDA5.5与VS2010的编译环境搭建

目前版本的cuda是很方便的,它的一个安装里面包括了Toolkit`SDK`document`Nsight等等,而不用你自己去挨个安装,这样也避免了版本的不同步问题。1 cuda5.5的下载地址,官方网站即可:     https://developer.nvidia.com/cuda-downl...

2013-10-15 09:34:32

阅读数 5299

评论数 0

CUDA: Threading的Block和Grid的設定與 Warp

硬體基本架構 實際上在 nVidia 的 GPU 裡,最基本的處理單元是所謂的 SP(Streaming Processor),而一顆 nVidia 的 GPU 裡,會有非常多的 SP 可以同時做計算;而數個 SP 會在附加一些其他單元,一起組成一個 SM(Streaming Multiproce...

2013-10-14 15:07:28

阅读数 1561

评论数 0

Using CUDA and Thrust with Visual Studio 2010

Using CUDA and Thrust with Visual Studio 2010Sunday, March 6, 2011 – 11:16 am Using CUDA 4.0 RC2? Read the update post here.I was working on setting ...

2013-10-13 00:13:26

阅读数 2535

评论数 0

CUDA: 共享存储器实现矩阵相乘

共享存储器使用__shared__限定词分配。  相关阅读:       CUDA编程接口:运行初始化与设备存储器  CUDA编程接口:使用nvcc编译器的兼容性  CUDA编程接口:如何用nvcc编译CUDA程序  CUDA编程模型:存储器层次和异构编程  CUDA编程模型:内核与线程层次概述 ...

2013-10-13 00:04:47

阅读数 3603

评论数 1

CUDA: 如何创建一个CUDA应用程序

现在最新的CUDA工具包已经发布,与Visual Studio的集成也变得更容易了,在这篇文章中,我将介绍如何使用Visual Studio 2008创建一个CUDA应用程序。▲图 1 将CUDA集成到Visual Studio  获得Visual Studio 2008的免费版本  Visual...

2013-10-12 15:44:25

阅读数 2311

评论数 0

CUDA: Windows 7 64位环境安装及配置

最近又有新的项目要做了,这次是关于CUDA---多核高性能计算的问题,所以最近一直在学习CUDA的编程问题,昨天安装软件完毕,运行第一个程序的时候还是遇到很多问题。所以这里给大家一起分享一下, 有和我一样初学CUDA的同志一起来吧。  安装  你需要的软件有四种:    其中,cuda的devdr...

2013-10-12 15:41:39

阅读数 2698

评论数 0

CUDA: Wizard环境下CUDA DLL开发流程

CUDA的DLL开发其实和一般的C/C++的DLL开发是一个原理,当然,DLL的开发就有几种方式,这里就讲最容易理解的,也最直接的方式,然后把代码放出来。大家自己可以琢磨一下其它的方式。  1. 创建DLL  用我的Wizard 可以创建一个DLL项目工程:  选择DLL项目,然后可以看到下面的项...

2013-10-12 15:39:05

阅读数 1741

评论数 0

CUDA: GPU的并行计算

请先看一段教程: 到目前为止,我们的程序并没有做什么有用的工作。所以,现在我们加入一个简单的动作,就是把一大堆数字,计算出它的平方和。  首先,把程序最前面的 include 部份改成:#include stdio.h>#include stdlib.h>#include cuda_r...

2013-10-12 15:34:29

阅读数 1951

评论数 0

OpenCV 2.2与CUDA 4.0的硬性结合

之前的文章中,给大家介绍了如何将OpenCV 2.2与CUDA 4.0的巧妙结合。今天尝试把CUDA 和 OpenCV 两者进行硬性结合。  建立一个 project,添加一个.cu 的文件。  按照之前的方法进行 OpenCV 和 CUDA 的配置:    我们看到.cu 文件的图标不好看,可以...

2013-10-12 15:26:12

阅读数 1768

评论数 0

CUDA: 检验执行时间

cuda里有cudaEvent_t,通过typedef struct CUevent_st *cudaEvent_t; 。CUevent_st这个结构体并没有看到源代码。也不需要仔细关注。  cudaEventCreate()函数能创建一个cudaEvent_t类型事件,如果需要记录时间,参数2就...

2013-10-12 15:08:23

阅读数 1632

评论数 0

CUDA SDK VolumeRender:跨编译单元调用

有关VolumeRender的介绍、和CUDA SDK中的VolumeRender解析在HERESY的一些文章中写的非常详细,这里我只想写写我对VolumeRender这个例子的一些理解。  曾经遇到过cuda函数在跨编译单元调用的问题,这个例子用到了一个很巧妙的解决方法。  首先描述下这个问题,...

2013-10-12 15:01:29

阅读数 1277

评论数 0

CUDA: DLL封装调用

本文将集中讨论如何使用CUDA代码创建一个非托管DLL,并在C#程序中使用它,列举的例子将展示在数组上做计算的for()循环的托管、非托管和新的.NET 4并行版本之间的一些差异。  我将简要地介绍如何配置CUDA环境和运行示例程序,CUDA本身已经超出了本文的范围,我只会谈及CUDA内核执行速度...

2013-10-12 14:54:27

阅读数 4520

评论数 0

提示
确定要删除当前文章?
取消 删除
关闭
关闭