【Paper Review】GAMMA：Gustavson SpMSpM Accelerator

线条艺术

已于 2024-11-06 17:05:56 修改

阅读量1k

点赞数 30

分类专栏： Paper 文章标签：系统架构

于 2024-11-06 17:05:19 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u014421633/article/details/143511855

版权

Gamma: Leveraging Gustavson’s Algorithm to Accelerate Sparse Matrix Multiplication, Guowei Zhang Nithya Attaluri Joel S. Emer Daniel Sanchez, ASPLOS '21

1. 问题背景

SpMSpM的应用场景

深度学习（大模型，模型压缩）
线性代数（专用指令集，Tensor Core）
图分析

SpMSpM（稀疏乘稀疏）的两个困难

减少数据搬运：算力扩张是容易的，提高并行度是困难的，主要受限于稀疏矩阵的存储格式是压缩的（跳过0值），而SpMxSpM意味着需要对两个乘数的下标进行对齐（Intersection），才能确定是否需要乘累加，因此相比于简单复制乘加单元来增加算力（在稠密场景下比较有收益），如何提高这种压缩后的数据的复用性是整个架构效率的关键
适应算法多样性：不同的数据pattern（稀疏度高低、结构化稀疏等）可能对应不同的tradeoff，也就产生了不同场景下的多种“最优”算法，如果加速器架构只能适应其中的一小部分，而在另一部分上表现较差，并不能算很好的设计，为了尽可能提高通用性，从SpMxSpM的底层dataflow进行思考是必要的，例如GAMMA对内外积和Gustavson的列举和分析

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。