IMX8基于FFT的GPU和CPU的性能测试

IMX8基于FFT的GPU和CPU的性能测试对比

i.MX 8系列应用处理器是一种功能和性能可扩展的多核平台,包括基于 Arm Cortex架构的单核、双核和四核系列产品,提供基于Cortex-A72 + Cortex-A53、Cortex-A35、Cortex-M4和Cortex M7组合的解决方案,适用于高级图形、成像、机器视觉、音频、语音、视频和安全关键应用。集成高性能的双核 GC7000 3D GPU,支持 Open GL ES 3.0 和Vulkan,最高支持4路 1080p或者1路 4K 显示。
由于免去了数据的远程传输,边缘计算能够带来更低的延时、更可靠的数据安全。但这也对边缘计算设备带来更大的挑战,特别是计算性能。下面我们将介绍如何在NXP 最新的 iMX8X ARM处理器上面利用 GPU 加速运算快速傅里叶变换 FFT
FFT 运行在GPU上(具体的运行方法可参考https://blog.csdn.net/qq_38505858/article/details/119642596)我之前写的一篇文章。

FFT 级数GPU TIME/s
160.002253
320.003386
640.002212
1280.003437
2560.003520
5120.004341
10240.002770
20480.006684
40960.007329
81920.005271
163840.003939
327680.007297
655360.007875

GPU 会根据采样点数,分解成多个蝶型运算模型,并将每个模型并行在 GPU 上执行,从而有效降低运算时间。从日志看到每个模型耗时都在1ms以内,GPU 累计耗时为0.004604 秒。但由于是并行计算,最终的时间则是小于该值。

FFT 运行在CPU上(FFTW库http://fftw.org/

FFT 级数GPU TIME/s
160.000576
320.000821
640.000986
1280.001110
2560.001854
5120.002455
10240.003548
20480.004353
40960.005370
81920.006686
163840.008905
327680.013279
655360.021859

相比较而言,在FFT的点数低的情况下,GPU没什么优势,但是随着FFT的点数增多,GPU的优势就会慢慢凸显出来。之后我会将FFT在CPU 上测试的源码和所需要的头文件库文件上传至我的资源,大家有需要的可以下载。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

疯狂的蕉尼基

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值