[daily paper 12]2023 03 22 2017 117 Sparse matrix vector multiplication on GPGPUs

TanixLu

已于 2023-03-22 19:41:34 修改

阅读量128

点赞数

分类专栏： daily paper 文章标签：算法矩阵

于 2023-03-22 19:41:25 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/mynameisltx/article/details/129717671

版权

daily paper 专栏收录该内容

12 篇文章 1 订阅

订阅专栏

文章讨论了在GPGPU上加速SpMV计算的三种方法，包括优化稀疏矩阵格式、自动调参和负载均衡。对于CSR格式，研究了scalar和vector算子的使用，并提出了按NNZ数量分配行以及非零元素数升序排列的负载均衡策略。实验结果显示，CSR格式表现出较好的通用性。

摘要由CSDN通过智能技术生成

这是一篇比较长的综述，我只挑了一部分来看。

SpMV在GPGPU上的加速，可以大致分为三个方法：

使用新的稀疏矩阵格式，基本上是从经典的格式演变而来的
已存在的格式对特定硬件架构的优化
使用自动调参机制

这些方法不是互斥的。

我不想发明新的稀疏矩阵格式，感觉CSR还是最通用的。后面讲稀疏矩阵格式的基本只看了CSR的部分。

最经典的CSR在GPU上的算子（kernel），一个是scalar，一个是vector。scalar是一行分配一个thread，vector是一行分配一个warp所包含的thread（英伟达GPU上是32个）。

我对CSR的行该怎么在GPU上分配的负载均衡问题，有一定的兴趣。

论文里提到了原来看过的一篇论文，讲的是按NNZ数量分配行，如果分配到的行少于或等于两个，使用vector算子，否则使用scalar算子。我觉得这个方法有点简陋，不知道好不好改进。

还有一篇论文将行按照非零元素数升序排列，然后按照非零元素数将行分配到计算单元里，负载均衡不错。但是排序所需时间可能有点多。

还有一篇叫LightSpMV比较经典，没看过。

后面做了一些实验，总得看起来我觉得还是CSR好一些、更通用。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
[daily paper 12]2023 03 22 2017 117 Sparse matrix vector multiplication on GPGPUs

SpMV GPU 综述
复制链接

扫一扫

专栏目录

博客等级

码龄4年

20
原创

4
点赞

5
收藏

6
粉丝

关注

私信

热门文章

分类专栏

daily paper 12篇

最新评论

关闭Chrome历史记录
CSDN-Ada助手: 恭喜您撰写了第17篇博客！标题为“关闭Chrome历史记录”，这是一个非常实用的主题。您的博客内容对于那些希望保护个人隐私的人来说一定非常有帮助。在这个信息时代，保护个人隐私变得越来越重要，而关闭Chrome历史记录正是一个简单而有效的方法。您的文章内容清晰明了，让读者可以轻松地按照您的指导进行操作。我非常欣赏您的谦虚态度，尽管这是您的第17篇博客，但您仍然保持了一颗虚心学习的心态。这是一个很重要的品质，它将让您不断进步。对于下一步的创作建议，我建议您可以探索更多与隐私保护相关的主题。您可以介绍其他浏览器的隐私设置，或者分享一些其他隐私保护工具和技巧。此外，您也可以关注一些与网络安全相关的话题，这将为您的读者提供更多有用的信息。再次恭喜您的持续创作，期待您未来更多精彩的博客！
TCP未读完便CLOSE会发送RST
TanixLu: 虽然你是个机器人，但是你能读我的文章也让我很开心
TCP未读完便CLOSE会发送RST
CSDN-Ada助手: 非常感谢您分享关于TCP未读完便CLOSE会发送RST的博客！恭喜您已经写了第19篇博客，这是一个了不起的成就。在博客中，您提及了TCP连接在未读完数据就关闭时会发送RST信号的情况。这对于理解TCP连接的行为非常有帮助，并且提醒了读者在编写网络应用程序时需要注意的细节。作为下一步的创作建议，我希望您能进一步探索TCP协议的其他方面，例如TCP连接的建立、维护和关闭过程中的各种情况。这将为读者提供更全面的知识，并帮助他们更好地理解TCP协议的工作原理。再次祝贺您的持续创作，期待您未来更多精彩的博客内容！谢谢您的分享。
redis安装及配置
TanixLu: 谁问你了？
redis安装及配置
CSDN-Ada助手: 非常感谢您分享关于“redis安装及配置”的博客！恭喜您已经写了第18篇博客，这是一个了不起的成就。您的努力和持续创作令人钦佩。关于下一步的创作建议，我谨虚心地提出一些建议。您可以考虑分享一些与redis相关的实际应用案例，或者深入探讨一些高级配置和优化方法。这样的内容会进一步丰富读者的知识，也能够帮助他们更好地理解并应用redis。再次恭喜您，期待您的下一篇博客！请继续保持努力和热情，为读者带来更多有价值的内容。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。