![](https://img-blog.csdnimg.cn/20201014180756780.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
SPMV源码解读
文章平均质量分 55
荼图
主打一个摸鱼
展开
-
学习日记-spmv(29)
后续的代码太复杂,准备在真正准备研究的时候再看。原创 2023-09-20 19:38:33 · 41 阅读 · 0 评论 -
学习日记-spmv(28)
【代码】学习日记-spmv(28)原创 2023-09-20 19:38:02 · 43 阅读 · 0 评论 -
学习日记-spmv(27)
【代码】学习日记-spmv(27)原创 2023-09-20 19:37:32 · 40 阅读 · 0 评论 -
学习日记-spmv(22)
【代码】学习日记-spmv(22)原创 2023-09-20 19:29:11 · 29 阅读 · 0 评论 -
学习日记-spmv(21)
【代码】学习日记-spmv(21)原创 2023-09-20 19:28:15 · 33 阅读 · 0 评论 -
学习日记-spmv(17)
SPMV稀疏矩阵向量乘笔记(17)CSR5:An Efficient Storage Format for Cross-Platform Sparse Matrix-Vector Multiplication 源码解读 (4)(avx2/512代码)昨天份遗留问题:empty_offset的生成问题,以为为啥不能直接生成empty_offset来替代y_offsetempty_offset是先计算bit_flag中T的位置,然后与row_ptr搜索来确定行数。而y_offset则是直接计算原创 2023-06-01 16:22:18 · 56 阅读 · 0 评论 -
学习日记-spmv(16)
在main中几乎一模一样,唯一不同的是就是多了个for循环,五次,里面A.asCSR5和A.asCSR依次执行,猜测是为了将部分数据放入cpu的缓存中,使得计算更快。其中的函数与cuda的基本一致,下面详细介绍spmv函数首先展示参数图。原创 2023-06-01 16:20:48 · 118 阅读 · 0 评论 -
学习日记-spmv(15)
SPMV稀疏矩阵向量乘笔记(15)CSR5:An Efficient Storage Format for Cross-Platform Sparse Matrix-Vector Multiplication 源码解读 (2)(cuda代码)main.cu->call_anonymouslib函数21-58行:将计算spmv所需要的数据复制到gpu上59-70行:将spmv相关操作封装成一个类,即anonymouslibHandle类,例如格式转换(csr->csr5)、进行spmv操原创 2023-06-01 16:18:55 · 87 阅读 · 0 评论 -
学习日记-spmv(14)
以下是示例输出,后续将不再展示:原创 2023-06-01 16:18:13 · 79 阅读 · 0 评论