![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
CUDA
Zeng Peng
这个作者很懒,什么都没留下…
展开
-
CUDA编程指南阅读笔记
随着多核CPU和众核GPU的到来,并行编程已经得到了业界越来越多的重视,CPU-GPU异构程序能够极大提高现有计算机系统的运算性能,对于科学计算等运算密集型程序有着非常重要的意义。这一系列文章是根据《CUDA C语言编程指南》来整理的,该指南是NVIDIA公司提供的CUDA学习资料,介绍了CUDA编程最基本最核心的概念,是学习CUDA必不可少的阅读材料。 初学CUDA,笔记错误之处在所难免,转载 2016-03-10 20:47:35 · 664 阅读 · 0 评论 -
OpenCV中GPU模块的使用
CUDA基本使用方法 在介绍OpenCV中GPU模块使用之前,先回顾下CUDA的一般使用方法,其基本步骤如下: 1.主机代码执行;2.传输数据到GPU;3.确定grid,block大小; 4.调用内核函数,GPU运行程序;5.传输结果到CPU;6.继续主机代码执行。 下图是两个向量相加的简单示例程序和处理流图。 注意的问题:cu,cpp文件的组织 内核函数和其wrapper转载 2016-03-10 20:50:34 · 899 阅读 · 0 评论 -
CUDA: 高效访问24位RGB图像
问题描述:利用GPU进行图像处理加速时,图像格式一般是RGB 3通道图像,每个通占用一个字节,即24位像素图像. 而cuda访问数据元素时,若每个线程访问8bit,16bit,32bit,64bit时,对应数据段长可以是32Byte,64Byte,128Byte,128Byte, 可以达到全局内存合并访问的要求,提高访问访问全局内存性能. 若每个线程访问24bit将无法达到全局内转载 2016-03-10 20:51:57 · 838 阅读 · 0 评论