[daily paper 10]2023 03 10 2014 217 Efficient SpMV on GPUs using the CSR storage format

最新推荐文章于 2024-07-10 22:11:08 发布

TanixLu

最新推荐文章于 2024-07-10 22:11:08 发布

阅读量166

点赞数

分类专栏： daily paper 文章标签：学习矩阵算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/mynameisltx/article/details/129457817

版权

daily paper 专栏收录该内容

12 篇文章 1 订阅

订阅专栏

这篇论文也是用的CSR格式在GPU上计算，是AMD发的一篇研究。上一篇论文说这一片论文是SpMV GPU计算的SOTA。

首先简单介绍一下AMD GPU的结构，如下图所示：

在这里插入图片描述

主要就是有一个LDS，每个CU（Computing Unit）本地的存储，也叫Shared Memory。

稀疏矩阵每一行的计算有两个极端，一种是每个线程一行，另一种是所有线程一行。

传统的CSR格式算法也有两个极端，CSR-Scalar和CSR-Vector，分别对应上述两个极端。但是传统的CSR-Scalar在CPU上运行的不错，在GPU上就不行了：

在这里插入图片描述

这是因为访问内粗不规则。

文中提出了一种针对GPU的类似于CSR-Scalar的算法，叫CSR-Stream。就是把数据先Stream到LDS上，然后再每个线程一行计算：

在这里插入图片描述

CSR-Stream对短行集合效果不错，但是如果行很长，就不能用这种方法了，可以中CSR-Vector。这两者结合，就形成了CSR-Adaptive算法，它会先将行划分成一个个row blocks，划分的标准应该是能否装到LDS里去。如果blocks行数过少，说明每行非零元过多，所以要用CSR-Vector，否则就用CSR-Stream。

文中做了实验确定了一些参数，一个是每个workgroup多少个非零元，结果是1024最好，然后行数为1或2的workgroup使用CSR-Vector。最终的效果非常好。

我觉得这篇文章提速的关键在于利用了LDS（shared memory）这个GPU存储结构，使得原来内存带宽的瓶颈缓解了。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
[daily paper 10]2023 03 10 2014 217 Efficient SpMV on GPUs using the CSR storage format

高效GPU SpMV框架：CSR-Adaptive
复制链接

扫一扫

专栏目录

TanixLu CSDN认证博客专家 CSDN认证企业博客

码龄4年

20: 原创

132万+: 周排名

153万+: 总排名

5839: 访问

: 等级

247: 积分

6: 粉丝

4: 获赞

6: 评论

4: 收藏

私信

关注

热门文章

分类专栏

daily paper 12篇

最新评论

关闭Chrome历史记录
CSDN-Ada助手: 恭喜您撰写了第17篇博客！标题为“关闭Chrome历史记录”，这是一个非常实用的主题。您的博客内容对于那些希望保护个人隐私的人来说一定非常有帮助。在这个信息时代，保护个人隐私变得越来越重要，而关闭Chrome历史记录正是一个简单而有效的方法。您的文章内容清晰明了，让读者可以轻松地按照您的指导进行操作。我非常欣赏您的谦虚态度，尽管这是您的第17篇博客，但您仍然保持了一颗虚心学习的心态。这是一个很重要的品质，它将让您不断进步。对于下一步的创作建议，我建议您可以探索更多与隐私保护相关的主题。您可以介绍其他浏览器的隐私设置，或者分享一些其他隐私保护工具和技巧。此外，您也可以关注一些与网络安全相关的话题，这将为您的读者提供更多有用的信息。再次恭喜您的持续创作，期待您未来更多精彩的博客！
TCP未读完便CLOSE会发送RST
TanixLu: 虽然你是个机器人，但是你能读我的文章也让我很开心
TCP未读完便CLOSE会发送RST
CSDN-Ada助手: 非常感谢您分享关于TCP未读完便CLOSE会发送RST的博客！恭喜您已经写了第19篇博客，这是一个了不起的成就。在博客中，您提及了TCP连接在未读完数据就关闭时会发送RST信号的情况。这对于理解TCP连接的行为非常有帮助，并且提醒了读者在编写网络应用程序时需要注意的细节。作为下一步的创作建议，我希望您能进一步探索TCP协议的其他方面，例如TCP连接的建立、维护和关闭过程中的各种情况。这将为读者提供更全面的知识，并帮助他们更好地理解TCP协议的工作原理。再次祝贺您的持续创作，期待您未来更多精彩的博客内容！谢谢您的分享。
redis安装及配置
TanixLu: 谁问你了？
redis安装及配置
CSDN-Ada助手: 非常感谢您分享关于“redis安装及配置”的博客！恭喜您已经写了第18篇博客，这是一个了不起的成就。您的努力和持续创作令人钦佩。关于下一步的创作建议，我谨虚心地提出一些建议。您可以考虑分享一些与redis相关的实际应用案例，或者深入探讨一些高级配置和优化方法。这样的内容会进一步丰富读者的知识，也能够帮助他们更好地理解并应用redis。再次恭喜您，期待您的下一篇博客！请继续保持努力和热情，为读者带来更多有价值的内容。

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。