CUDA并行计算
Robin Long 2018
软弱的拖沓,有保留的付出,都是浪费青春。
展开
-
CUDA:并行计算实现矩阵相加
(一)目的熟悉基本的CUDA程序架构以及如何调用相应的API进行CUDA编程(二)内容完成矩阵相加的并行程序的实现(不用share memory实现)要求:实现2个矩阵(32*32)的相加,M矩阵的初始值全为2,N矩阵的初始值全为5。同时用CPU代码实现,比较两个代码的运行时间 实现2个矩阵(1024*1024)的相加,M矩阵的初始值全为2,N矩阵的初始值全为5。同时用...原创 2018-10-18 21:58:29 · 8728 阅读 · 4 评论 -
CUDA:并行计算实现求一个矩阵中的最大值的几种方法
(一)目的熟悉基本的CUDA程序架构以及如何调用相应的API进行CUDA编程(二)内容掌握如何运用共享内存与并行归约方法计算1个矩阵中的最大值要求:实现1个矩阵(256*1024)最大值计算,初始值随机产生,值的范围限定在[1-2018]。 实现4个版本,分别计算运行时间版本1:CPU实现版本2:GPU用全局内存及并行归约(有分支发散)版本3:GPU用全...原创 2018-10-18 22:03:28 · 10008 阅读 · 12 评论 -
CUDA:用并行计算的方法对图像进行直方图均衡处理
(一)目的将所学算法运用于图像处理中。(二)内容用并行计算的方法对图像进行直方图均衡处理。要求:利用直方图均衡算法处理lena_salt图像版本1:CPU实现版本2:GPU实现 实验步骤一 软件设计分析:数据类型:根据实验要求,本实验的数据类型为一个256*256*8的整型矩阵,其中元素的值为256*256个0-255的灰度值。存储方式:图像在内存中的存储...原创 2018-10-18 22:08:26 · 3723 阅读 · 10 评论 -
CUDA:并行计算实现一维二维和表
(一)目的掌握编写高性能的扫描kernel。两个阶段的平衡树遍历;更好的中间结果重用;减少控制分歧与更复杂的线程索引与数据索引映射。(二)内容分别利用CPU和GPU生成的一个256 * 1024的和表,设置矩阵的初始值为2,在此基础上进行处理,生成和表。包括以下内容:版本一:CPU实现一维和表版本二:CPU实现二维和表版本三:GPU实现一维和表版本四:GPU实现二维和表...原创 2018-10-18 22:12:06 · 1872 阅读 · 3 评论 -
CUDA:并行计算实现图像平滑去噪
原创 2018-10-18 22:24:05 · 2734 阅读 · 5 评论