使用MATLAB进行GPU高级编程

最新推荐文章于 2024-01-13 16:32:48 发布

zd0303

最新推荐文章于 2024-01-13 16:32:48 发布

阅读量1w

点赞数 3

分类专栏： matlab 文章标签： matlab 编程 fft 多线程工作算法

matlab 专栏收录该内容

31 篇文章 0 订阅

订阅专栏

GPU能够对符合以下标准的应用程序进行加速：
　　大规模并行—计算能够被分割成上百个或上千个独立的工作单元。

　　计算密集型—计算消耗的时间显著超过了花费转移数据到GPU内存以及从GPU内存转移出数据的时间。

　　不满足上述标准的应用程序在GPU上运行时可能会比CPU要慢。

　　使用MATLAB进行GPU编程

　　FFT，IFFT以及线性代数运算超过了100个内置的MATLAB函数，通过提供一个类型为GPUArray(由并行计算工具箱提供的特殊数组类型)的输入参数，这些函数就能够直接在GPU上运行。这些启用GPU的函数都是重载的，换句话说，这些函数根据传递的参数类型的不同而执行不同的操作。

　　例如，以下代码使用FFT算法查找CPU上伪随机数向量的离散傅里叶变换：

　　A = rand(2^16,1);

　　B = fft (A);

　　为在GPU上执行相同的操作，我们首先使用gpuArray命令将数据从MATLAB工作空间转移至GPU设备内存。然后我们能够运行重载函数fft：

　　A = gpuArray(rand(2^16,1));

　　B = fft (A);

　　fft操作在GPU上而不是在CPU上执行，因为输入参数(GPUArray)位于GPU的内存中。

　　结果B存储在GPU当中。然而，B在MATLAB工作空间中依旧可见。通过运行class(B)，我们看到B是一个GPUArray。

　　class(B)

　　ans =

　　parallel.gpu.GPUArray

　　我们能够使用启用GPU的函数继续对B进行操作。例如，为可视化操作结果，plot命令自动处理GPUArrays。

　　plot(B);

　　为将数据返回至本地的MATLAB工作集，你可以使用gather命令。例如

　　C = gather(B);

　　C现在是MATLAB中的double，能够被处理double变量的所有MATLAB函数操作。

我们在每一个时间步长使用切比雪夫波普法计算当前解决方案的在x象限和y象限的二次导数。我们同时使用这些中间数值与旧的解决方案和新的解决方案，应用二阶中心有限差分法(也称为蛙跳法)计算新的解决方案。我们选择了保持蛙跳法稳定性的时间步长。

　　MATLAB算法是计算密集型的，当网格中元素的数目超过了计算解决方案的增长，算法的执行时间将显著增加。当在单个CPU上使用2048x2048的网格执行时，完成50个时间步长需要一分多钟。需要指出的是我们计算的时间已经包括了MATLAB内在的多线程性能优势。自从R2007a起，MATLAb的一些函数就支持多线程计算。这些函数自动在多线程上执行，并不需要在代码中显示指定命令去创建线程。

　　当考虑如何使用并行计算工具箱加速计算时，我们将关注每个时间步长所执行的计算指令代码。图3距离说明了为获取在GPU上运行的算法需要做出的改变。需要指出的是涉及MATLAB操作的计算指令、启用GPU的重载函数可以从并行计算工具箱获取。这些操作包括FFT，IFFT，矩阵乘法，以及各种元素明智(element-wise)操作。因此，我们不必改变算法就能够在GPU执行。只需要在进入每个时间步长计算结果的循环前使用gpuArray将数据转移到GPU当中。

计算指令在GPU上执行后，我们将计算结果从GPU转移至CPU。被启用GPU的函数所引用的每个变量必须在GPU上创建或者在使用前转移到GPU上。

　　为将用于光谱分化的一个权重转变为GPUArray变量，我们使用

　　W1T = gpuArray(W1T);

　　某些类型的数组能够直接在GPU上构造，不用从MATLAB工作集转移。例如，为直接在GPU上创建全零矩阵，我们使用

　　uxx = parallel.gpu.GPUArray.zeros(N+1,N+1);

　　我们使用gather函数将数据从GPU中转移回MATLAB工作集;例如：

　　vvg = gather(vv);

　　需要指出的是这只是将一个数据转移至GPU，然后从GPU转移回MATLAB工作集。每个时间步长的所有计算指令都是在GPU上执行的。

关注

3
点赞
踩
7

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

zd0303 CSDN认证博客专家 CSDN认证企业博客

码龄15年

72: 原创

12万+: 周排名

219万+: 总排名

122万+: 访问

: 等级

7660: 积分

344: 粉丝

379: 获赞

83: 评论

1348: 收藏

私信

关注

热门文章

分类专栏

c语言 14篇
matlab 31篇
linux 30篇
Latex 17篇
计算机 16篇
信号处理 12篇
English 4篇
数学 3篇
计算机视觉 10篇
python 9篇
数据库
机器学习 1篇
JAVA
x

最新评论

希尔伯特变换简介
流星奶香包: 文中有几处小的笔误请留意一下：（1）“所以，Hilbert逆变换的公式显而易见，就是将正变换加一个符号即可。” 应该将“符号”改为“负号”才对。（2）“对x(t)进行Hilbert变换，并求解析信号，并使用欧拉公式表示”后面的表达式缺了一个虚数单位j。还是很感谢作者写的这么详细，谢谢！
希尔伯特变换简介
流星奶香包: 作者你好！在这句话 “因此x(w)的虚部的频率部分可以写成下式” 应该改为“x(t)的希尔伯特变换的傅里叶变换X^(w)可以写成下式”，然后是相乘而不是卷积，感觉会更好一些。
希尔伯特变换简介
Scorpio_feng_: “因此x(w)的虚部的频率部分可以写成下式”。下面这个式子应该是相乘而不是卷积吧。
Matlab获取鼠标坐标值的两种途径
m0_73687039: 我也是这样，xy没办法读取出来，请问你解决了么
error: cannot convert `char (*)[4]' to `char**' in return
Cym_cd10x: 那怎么解决呢？

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。