学习日记-spmv（22）

最新推荐文章于 2024-07-15 16:40:29 发布

荼图

最新推荐文章于 2024-07-15 16:40:29 发布

阅读量29

点赞数

分类专栏： SPMV源码解读文章标签：学习

本文链接：https://blog.csdn.net/qq_43713798/article/details/133096099

版权

9 篇文章 0 订阅

订阅专栏

SPMV稀疏矩阵向量乘笔记（22）

包含了#include <cusp/io/matrix_market.h>
printUsage()：输出相关信息
parseArgs()：
- 42-98：解析输入的参数argc, argv，使用的是c语言的getopt函数
- 99-110：检测矩阵名是否合法；getGPUs函数：获取gpu上的相关信息,使用vector<pair<int32_t, struct cudaDeviceProp> > _gpus;和cudaGetDeviceProperties
- 111-168：加载矩阵数据、X和Y
loadMatrixMarketFile()：
- 175-210：使用csr_matrix创建csr矩阵，然后使用read_matrix_market_file读取矩阵数据，然后分配内存，并且使用cudaMallocHost来分配保留内存。
loadVector()：用于加载x和y的向量文件并且赋值，即-x和-y，如何没有指定就默认x为1.0，y为0
getRowSizeVariance()：输入矩阵的相关信息，行数、列数、行非零元平均个数

loadData()：
- 122-132：定义是否使用纹理内存
- 135-150：复制opt中的数据到gpu，cudaMemcpyToSymbol()功能为主机内存复制到常量设备内存
- 151-213：加载矩阵相关数据，vector<pair>>将两个数据合成一个，类似于哈希表一样，用first和second定义
getSysTime()：获取当前时间，在运算前后各获取一次，得出spmv的时间
spmvKernel()：其中主要靠SpMVFloatWarp()实现，该函数中通过_meanElementsPerRow变量，即行平均非零元来决定csr32DynamicWarp()中的参数，该函数是主要实现spmv的核心
注：代码中许多#ifdef FLOAT_USE_TEXTURE_MEMORY，是用来判断是否使用纹理内存的，X向量可以决定是否存储在纹理内存中，即对x使用const cudaTextureObject_t还是 const T* __restrict来修饰