https://zhuanlan.zhihu.com/p/620575933?utm_id=0
《Optimization of Block Sparse Matrix-Vector Multiplication on Shared-Memory Parallel Architectures》
减少了数据存储数量,本质还是没有做到合并访存,没有测试过具体优化效果。
https://zhuanlan.zhihu.com/p/620575933?utm_id=0
《Optimization of Block Sparse Matrix-Vector Multiplication on Shared-Memory Parallel Architectures》
减少了数据存储数量,本质还是没有做到合并访存,没有测试过具体优化效果。