Augusdi的专栏

攀登技术的高峰,我与大家共勉!

CUDA和OpenCL全解释

Khronos组织最近规范了OpenCL 1.0, OpenCL实际上是针对异构系统进行并行编程的一个全新的API,简单来说OpenCL它可以利用GPU,然后进行一些并行计算这方面的工作,这是API应用程序的编程接口,图形里面也有很多API,比如OpenGL那是针对图形的,OpenCL是针对并行计...

2013-09-30 23:43:12

阅读数 1498

评论数 0

CUDA下的GPU编程--线程和变量

CUDA的线程是多维的,启动一个线程格,线程格可以是多维的,线程格中分为线程块,线程块也可以是多维的,线程块中包含线程,对于GPU来说,同时启动200万个线程是很轻易的事情。blockIdx :当前执行设备代码的线程块的索引dim3 grid(DIM,DIM):声明一个二维的线程格,名字为grid...

2013-09-30 23:41:13

阅读数 1541

评论数 0

CUDA的OpenCV-2.3.x/OpenCV-2.4.x编译

版权声明:对于本博客所有原创文章,允许个人、教育和非商业目的使用,但务必保证文章的完整性且不作任何修改地以超链接形式注明原始作者、出处及本声明。    博客地址:http://blog.csdn.net/shuxiao9058    原始作者:季亚    前面,我们讲到了使用OpenCV-2.4....

2013-09-30 23:35:54

阅读数 1995

评论数 0

CUDA 与 OpenCL 区别

根据网站资料,简单地汇编一下CUDA与OpenCL的区别。如有错误请指出。题外话: 美国Sandia国家实验室一项模拟测试证明:由于存储机制和内存带宽的限制,16核、32核甚至64核处理器对于超级计算机来说,不仅不能带来性能提升,甚至可能导致效率的大幅度下降。什么是OpenCL?是由苹果(Appl...

2013-09-30 23:32:52

阅读数 1948

评论数 0

CUDA和OpenCV实现的图像GAMMA变换

一个很简单的CUDA程序,适合刚刚接触CUDA的人了解CUDA的工作原理,以及与OpenCV结合的基本用法。#include #include #include #include #include "cutil_inline.h" #define GAMM...

2013-09-30 23:30:04

阅读数 2792

评论数 1

CUDA实现 全局光照中辐射度(Radiosity)算法

http://blog.csdn.net/BugRunner/article/details/5366692  1. 简介辐射度算法是一种经典的全局光照算法,它可以解决光线跟踪等直接照明方法中所不能表现的真实世界中的照明现象问题。虽然渲染的结果表现力强,但是问题之一就是算法的耗费较大,由于其原理就...

2013-09-30 23:28:01

阅读数 2679

评论数 0

CUDA任意维度的矩阵相乘

__global__ void matrixMul( float* A, float* B, float* C, int hA,int wA, int wB) { int bx = blockIdx.x; int by = blockIdx.y; int tx = threadIdx.x;...

2013-09-30 23:23:49

阅读数 3696

评论数 0

CUDA和OpenCL

源地址:http://www.qingran.net/2011/07/cuda%e5%92%8copencl/作者:夏清然虽然我们可以使用已有的图形API来调用GPU,但是通过前文的分析,这个过程冗长且复杂。严重违反了程序员的优雅、和lazy原则。需要去学习图形学的一些知识,了解texture、s...

2013-09-30 23:22:56

阅读数 2241

评论数 0

CUDA 深入浅出谈

CUDA 深入浅出谈          “CUDA 是 NVIDIA 的 GPGPU 模型,它使用 C 语言为基础,可以直接以大多数人熟悉的 C 语言,写出在显示芯片上执行的程序,而不需要去学习特定的显示芯片的指令或是特殊的结构。”         “CUDA 是 NVIDIA 的 GPGPU 模...

2013-09-30 23:12:31

阅读数 6939

评论数 0

深入浅出谈CUDA

深入浅出谈CUDA2009-2-5 作者: he21he21 来源: he21he21关键字: CUDA NVIDIA   CUDA是什么?能吃吗?  编者注:NVIDIA的GeFoce8800GTX发布后,它的通用计算架构CUDA经过一年多的推广后,现在已经在有相当多的论文发表,在商业应用软件等...

2013-09-30 23:04:11

阅读数 1466

评论数 0

CUDA写显卡内存的FFT问题。

今天尝试用cuda把FFT实现,遇到了难题。直接调用cufft库的话,内存拷贝与数据处理的时间比大约是1:2。但是据说cufft并不是最高效的,所以想自己锻炼一下。 我的思路是将二维的每一行映射到一个block,每个点都是一个thread。先将数据拷贝到显卡全局内存,然后拷贝到每个block的共享...

2013-09-30 22:51:52

阅读数 2610

评论数 0

CUDA的配置与入门

开始接触CUDA,我安装好后完全不知道怎么运行demo,当然也没有见到详细的安装说明。下面说说我的经验。Platform:Win XP64IDE:VS20081 获取可访问以下网址:http://www.nvidia.com/object/cuda_get.html共需下载3个应用程序,分别是:1...

2013-09-30 22:48:04

阅读数 5834

评论数 0

CUDA函数前缀与存储器前缀讨论

转自:http://space.itpub.net/?uid-23172605-action-viewspace-itemid-627164在CUDA C语言对C语言的扩展之一就是加入了一些函数前缀和存储器前缀,它们是:函数前缀:__device__ , __global__, __host__存...

2013-09-30 20:46:58

阅读数 1334

评论数 0

CUDA编程基本概念与矩阵运算

1、并行计算1)单核指令级并行ILP---让单个处理器的执行单元可以同时执行多条指令2)多核并行TLP---在一个芯片上集成多个处理器核心,实现线程级并行3)多处理器并行---在一块电路板上安装多个处理器,并实现进程和线程级并行4)可借助网络实现大规模的集群或者分布式并行,每个节点就是一台独立的计...

2013-09-30 20:42:02

阅读数 6213

评论数 0

CUDA笔记

CPU代码作用:在kernel启动前进行数据准备和设备初始化的工作,以及在kernel之间进行的一些串行运算。理想状况下 ,CPU串行代码的作用只是清理上一个kernel函数,并启动下一个kernel函数。       CUDA并行计算函数kernel:它是整个CUDA程序中的一个可以被并行执行的...

2013-09-30 20:33:45

阅读数 1634

评论数 0

OpenCV: 实现将三幅图像合并在一张图片

*****************/ #include #include int main() { char* filePath ="D:/图片库/Lena.jpg"; IplImage* srcImg = cvLoadImage(filePat...

2013-09-30 20:09:59

阅读数 5421

评论数 1

CUDA之VS2010中配置CUDA5.0

原文地址:http://blog.csdn.net/diyoosjtu/article/details/84542531、安装之前必须确认自己电脑的GPU支持CUDA。在设备管理器中找到显示适配器(Display adapters),找到自己电脑的显卡型号,如果包含在http://www.nvid...

2013-09-30 19:45:43

阅读数 1397

评论数 0

CUDA中__threadfence()的含义与理解

在CUDA里面,不同线程间的数据读写会彼此影响,这种影响的作用效果根据不同的线程组织单位和不同的读写对象是不同。在不考虑2.x的优化的情况下,(1)在同一个warp内的线程读写shared/global,  读写global和shared是立刻对本warp内的其他线程立刻可见的。(2)在同一个bl...

2013-09-30 19:40:41

阅读数 2064

评论数 0

CUDA开发环境配置大全

原文地址:http://cudazone.nvidia.cn/forum/forum.php?mod=viewthread&tid=3735一、操作系统:(1)windows操作系统:1.windows xp:(1)       win32_xp_ CUDA3.0_VS2010_配置指南-...

2013-09-30 19:38:38

阅读数 2646

评论数 0

VS2010配置CUDA5.0

1.安装CUDAhttp://blog.csdn.net/mrzhufeng/article/details/91865152.VS创建控制台空项目Properties--->VC++ Directories 设置头文件目录和库目录Linker---->Input加入lib3.选择编译...

2013-09-30 19:37:37

阅读数 2114

评论数 0

提示
确定要删除当前文章?
取消 删除
关闭
关闭