2023年英特尔oneAPI校园Mini黑客松竞赛参赛作品——“BM3D优化加速”

swpudxf

已于 2023-10-25 14:04:20 修改

阅读量287

点赞数

文章标签： oneapi 人工智能

于 2023-10-25 13:23:55 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/dxf2003/article/details/134031006

版权

一：团队名称

西南石油大学：龙井湖

二：问题描述

当今时代信息飞速发展，图像作为传输方便，信息量大的一种数据载体得到人们越来越多的关注和使用。由于图像采集时受环境和采集仪器内部电路的影响，往往拍摄的图像除了人们想要的图像信息，还有大量的噪声信息，这些噪声信息会干扰后续图像加工的结果，比如图像的拼接、融合、识别等等，因此图像去噪时所有图像处理的前提，而去噪效果的好坏会直接影响后续图像处理的结果。在这些传统降噪算法中，最经典而强大的莫过于 BM3D 了。

三：解决方案

Ⅰ：方案简述

我们首先使用Intel® oneAPI Base Toolkit里的VTune™ Profiler对代码进行分析。然后对整个代码流程有个大致的优化步骤

可以看到对于整个BM3D算法，函数precompute_BM占用了绝大多数的时间我们主要对此热点函数进行了异构移植的优化并采用并行加速算法。

Ⅱ：部分代码移植方法

1：替换数据结构

对于整个函数我们使用usm统一共享内存申请空间代替了原有代码的vector。usm基于指针，我们更加熟悉。使用usm更加简化了我们的工作同时意味着主机上的usm返回的指针都是设备上的有效指针我们并不需要手动的转换主机指针来获得设备指针。

并且对于patch_table我们使用一维替代原有的二维，这可以减少内存访问、延迟线性内存访问，提高数据存储的效率

2：GPU计算初始化

对于整个热点函数我们使用了合并循环层次为一个工作组的方法通过使用多个维度重现原代码的多个循环层次如：

源代码中计算补丁距离的部分中计算平方距离的部分我们将代码提出到循环外单独计算使用（height - 2 * nhw ）* （width - 2 * nhw）个工作组每个工作组开辟nhw个工作项来进行计算

3：GPU移植

对于块匹配部分我们更改原来的vector和pair的数据结构为两个一维数组来存放使得访存更加连续将预计算块匹配提交到gpu上分层次并行，取得了不错的加速效果。

同时我们通过观察代码和查找论文发现块间距离排序这一部分是属于冗余，我们将它去除了。

四：图像效果展示

左图为原始图像右图为加噪声值20之后的图像我们使用BM3D算法进行去噪后得到数据

我们对于原始代码去噪后的数据发现去噪效果差异不大

五：加速效果展示

上图为加速之前的时间下图为加速之后的时间。最终达到了约12x的加速比

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
3
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

swpudxf CSDN认证博客专家 CSDN认证企业博客

码龄3年

14: 原创

74万+: 周排名

62万+: 总排名

1万+: 访问

: 等级

276: 积分

473: 粉丝

106: 获赞

22: 评论

98: 收藏

私信

关注

热门文章

最新评论

2023年英特尔oneAPI校园Mini黑客松竞赛参赛作品——“BM3D优化加速”
CSDN-Ada助手: 恭喜您写下了第12篇博客！标题看起来非常令人期待，参加英特尔oneAPI校园Mini黑客松竞赛的作品一定充满创意。我对您的“BM3D优化加速”非常感兴趣，期待能够读到您在这项竞赛中的创新成果。在下一步的创作中，我想提供一些建议：您可以尝试深入探索您的竞赛作品的技术细节，例如，您是如何利用英特尔oneAPI技术来优化BM3D算法的加速呢？您可以分享一些实验结果和性能提升的数据，以及您在解决挑战过程中遇到的问题和解决方案。此外，如果您想进一步扩展您的创作领域，您可以考虑与其他竞赛参与者或同行交流，了解他们的作品和想法。这样的交流可以为您提供新的灵感和洞察力，进一步拓宽您的视野。再次祝贺您的持续创作，期待能够阅读到更多精彩的博客文章！请继续保持谦虚的态度，您的努力和创造力一定会得到更多人的认可和赞赏。
Oneapi--C++与SYCL异构编程学习（一）
CSDN-Ada助手: 恭喜作者完成了第10篇博客！标题中提到的Oneapi与SYCL异构编程学习引起了我的兴趣。我很期待阅读您的文章，了解更多关于这个主题的知识。同时，我想提供一些建议，希望能对您的下一步创作有所帮助。或许您可以深入探讨一下SYCL的应用场景，或者分享一些实际案例，以帮助读者更好地理解和应用这一技术。谢谢您的不断努力，期待您的下一篇博客！
C++与SYCL异构编程学习（二）
CSDN-Ada助手: 恭喜您写完了第11篇博客！标题为“C++与SYCL异构编程学习（二）”。您的学习进度真是令人钦佩！我非常期待您在这个系列中的下一篇博客。不过，如果我可以提供一个创作建议的话，希望您能够结合实际案例或者示例代码，进一步深入探讨C++与SYCL异构编程的应用场景。这样的话，读者们可以更好地理解和应用这些知识。希望您能够继续保持创作的热情，期待看到更多精彩的博客文章！
C++与SYCL异构编程学习（二）
swpudxf: 收到

大家在看

最新文章

目录

评论 3

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。