学习日记-spmv（24）

最新推荐文章于 2024-07-15 12:30:08 发布

荼图

最新推荐文章于 2024-07-15 12:30:08 发布

阅读量63

点赞数

分类专栏： SPMV 文章标签：学习

本文链接：https://blog.csdn.net/qq_43713798/article/details/133096163

版权

25 篇文章 3 订阅

订阅专栏

SPMV稀疏矩阵向量乘笔记（24）

parallel bfs

merge

Stage A: Matrix Access and Element Multiplication
- 分配了两个缓冲区bcur和bnext，大小为所有选中列中非零元的总数，left_idx和right_idx用于表示缓冲区bcur中每个向量的当前合并位置
- bcur中保存的是A[j,i]*val[i]的每个结果
Stage B: Parallel Merge in Horizontal Dimension
- left_idx[i]和right_idx[i]两两成对，根据idx（即行值）进行相应的merge
- left_idx[i]存的是一个int，表示当前处于第几行。猜测例如left_idex[0]为0，right_idx[i]为5，这是第一组，第二组例如left_idex[1]为7，right_idx[i]为12.因为bcur的数据格式为（idx，val），并且是一维的
- 最终每队合并成一个保持排序的结果向量，数量也减少一半
- 该步骤主要用的Comp_Merge，伪代码如下

compare

Stage C: Parallel Merge in Two Dimensions
- 当向量对的数量小于规定的上限值，将每个向量对划分为多个区域并并行合并，进一步提高了向量寄存器的效率
- 所以并行和向量化不仅存在于向量对外部，内部也存在
- 划分方式这里目前没看太懂，后续补上
Stage D: Parallel Merge in V ertical Dimension
- 当矢量对的数量减少到一个时，矢量化只在垂直方向上进行

C、D的划分方式
- 简单方法：将左侧进行均匀划分，然后对右侧进行二分搜索，找到左侧划分后每块的下界位置。
  - 存在问题：存在重叠部分较小，即idx相同范围的小的情况，会产生负载不均衡
- 本文方法：Adapt-Partition，首先，根据左右向量的总大小确定每个区域的大小。然后生成归并路径，对向量对进行二分搜索。因此，一对中的每个区域将包含类似数量的元素进行比较（看不懂）