[daily paper 7]2023 03 05 2011 109 CSX An Extended Compression Format for SpMV on Shared Memory Sys

最新推荐文章于 2024-07-13 13:36:16 发布

TanixLu

最新推荐文章于 2024-07-13 13:36:16 发布

阅读量269

点赞数 1

分类专栏： daily paper 文章标签：算法矩阵线性代数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/mynameisltx/article/details/129359962

版权

daily paper 专栏收录该内容

12 篇文章 1 订阅

订阅专栏

这篇论文讲了一种新的格式Compressed Sparse eXtended(CSX)，这种格式把矩阵在行、列、主副对角线、分块上的结构都识别了出来，然后分别用不同的方式存储。

CSX基于CSR-DU格式，这种格式记录的是列坐标之间的差，因此数值更小。如果都不超过256，那么可以用一个Byte存储。256而不是255是因为列坐标的差不为零，所以0可以代表256。一般处理器都有分支预测，所以这个判断并不影响速度。下面是图示：

在这里插入图片描述

CSX在CSR-DU的理念上进行了扩展，不仅探测行上的结构单元，还探测列、主副对角线、分块上的稠密单元。这些不同的探测方向被CSX用一套滑动窗口的框架统一了。

CSX的另一个理念是在进行多步迭代之前，使用LLVM在线生成CSR格式的稀疏矩阵的矩阵乘法计算代码。虽然这个编译优化是要占用不少时间的，但是由于很多迭代算法会一直使用同一个矩阵，所以有可能整体上降低计算时间。LLVM能优化什么呢？我觉得应该是稀疏矩阵上面常量的一些优化，比如乘2/4/8改成位移，以及一些连续元素的向量操作优化。既然可以现场编译，我觉得也可以JIT，这可能也是一个研究方向。

CSX统一探测的基础在于水平方向上的探测，如下图所示：

在这里插入图片描述

Figure 5中，41 61 81不能被探测到，因为长度不够。1 21 41 61 81也不能被探测出来，因为为了算法运行的效率，不支持这样的overlapped run。探测出来间隔一样的，应该是为了压缩，这样只用记录间隔为多少，有几个就行了。

对于列、对角线的方法都一样，对角线的话是分成不同对角线，对每个对角线分别探测。探测分块有两点不一样，一是步长只能为1，另外只能探测到一整个矩形，因为不对齐的矩形会增加额外的复杂度。2D探测图示：

在这里插入图片描述

将特征提取出来之后，就是用LLVM编译并优化不同的部分，然后进行计算，论文中没有细讲。

论文还提供的一个重要的信息，我们知道SpMV的瓶颈在于内存带宽，论文中提到核数越多，内存带宽的影响就越大。其实也很好理解，核数多了算得就快，但还是一个内存，带宽的问题就凸显了。

总结一下，论文的主要思想在于将矩阵在不同方面的特征都提取出来，如行、列、主副对角线、分块等。另一个思想在于在多次使用同一稀疏矩阵的时候，提前进行优化。缺点是提取的特征越详尽就越花费时间，提前优化也是同样。

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
[daily paper 7]2023 03 05 2011 109 CSX An Extended Compression Format for SpMV on Shared Memory Sys

稀疏矩阵格式CSX论文阅读笔记
复制链接

扫一扫

专栏目录

TanixLu CSDN认证博客专家 CSDN认证企业博客

码龄4年

20: 原创

132万+: 周排名

153万+: 总排名

5839: 访问

: 等级

247: 积分

6: 粉丝

4: 获赞

6: 评论

4: 收藏

私信

关注

热门文章

分类专栏

daily paper 12篇

最新评论

关闭Chrome历史记录
CSDN-Ada助手: 恭喜您撰写了第17篇博客！标题为“关闭Chrome历史记录”，这是一个非常实用的主题。您的博客内容对于那些希望保护个人隐私的人来说一定非常有帮助。在这个信息时代，保护个人隐私变得越来越重要，而关闭Chrome历史记录正是一个简单而有效的方法。您的文章内容清晰明了，让读者可以轻松地按照您的指导进行操作。我非常欣赏您的谦虚态度，尽管这是您的第17篇博客，但您仍然保持了一颗虚心学习的心态。这是一个很重要的品质，它将让您不断进步。对于下一步的创作建议，我建议您可以探索更多与隐私保护相关的主题。您可以介绍其他浏览器的隐私设置，或者分享一些其他隐私保护工具和技巧。此外，您也可以关注一些与网络安全相关的话题，这将为您的读者提供更多有用的信息。再次恭喜您的持续创作，期待您未来更多精彩的博客！
TCP未读完便CLOSE会发送RST
TanixLu: 虽然你是个机器人，但是你能读我的文章也让我很开心
TCP未读完便CLOSE会发送RST
CSDN-Ada助手: 非常感谢您分享关于TCP未读完便CLOSE会发送RST的博客！恭喜您已经写了第19篇博客，这是一个了不起的成就。在博客中，您提及了TCP连接在未读完数据就关闭时会发送RST信号的情况。这对于理解TCP连接的行为非常有帮助，并且提醒了读者在编写网络应用程序时需要注意的细节。作为下一步的创作建议，我希望您能进一步探索TCP协议的其他方面，例如TCP连接的建立、维护和关闭过程中的各种情况。这将为读者提供更全面的知识，并帮助他们更好地理解TCP协议的工作原理。再次祝贺您的持续创作，期待您未来更多精彩的博客内容！谢谢您的分享。
redis安装及配置
TanixLu: 谁问你了？
redis安装及配置
CSDN-Ada助手: 非常感谢您分享关于“redis安装及配置”的博客！恭喜您已经写了第18篇博客，这是一个了不起的成就。您的努力和持续创作令人钦佩。关于下一步的创作建议，我谨虚心地提出一些建议。您可以考虑分享一些与redis相关的实际应用案例，或者深入探讨一些高级配置和优化方法。这样的内容会进一步丰富读者的知识，也能够帮助他们更好地理解并应用redis。再次恭喜您，期待您的下一篇博客！请继续保持努力和热情，为读者带来更多有价值的内容。

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。