稀疏矩阵的压缩存储方法

1 什么是稀疏矩阵:
        在矩阵中,我们常见的都是稠密矩阵,即非0元素数目占大多数时;若数值为0的元素数目远远多于非0元素的数目,并且非0元素分布没有规律时,则称该矩阵为稀疏矩阵。与之相区别的是,如果非零元素的分布存在规律(如上三角矩阵、下三角矩阵、对角矩阵),则称该矩阵为特殊矩阵。下图1为一个稀疏矩阵的示例

                                            图1
        稀疏因子是用于描述稀疏矩阵的非零元素的比例情况。设一个n*m的稀疏矩阵A中有t个非零元素,则稀疏因子δ的计算公式如下:δ=t/(n∗m), 当这个值小于等于0.05时,可以认为是稀疏矩阵

2 稀疏矩阵的存储方式

        存储矩阵的一般方法是采用二维数组,其优点是可以随机地访问每一个元素,因而能够较容易地实现矩阵的各种运算。但对于稀疏矩阵而言,若用二维数组来表示,会重复存储了很多个0了,浪费空间,而且要花费时间来进行零元素的无效计算。所以必须考虑对稀疏矩阵进行压缩存储。

        最常用的稀疏矩阵存储格式主要有:三元组(i,j,a(i,j))CSR(Compressed Sparse Row)。

(1) 三元组(i,j,a(i,j))(也叫COO(Coordinate Format))

        三元组(i,j,a(i,j))很简单,就是使用3个数组,分别存储全部非零元的行下标(row index)、列下标(column index)和值(value)

typedef struct
{
    int row;        //行坐标
    int col;        //列坐标
    int value;    //该点的值
} item;

        这里item表示矩阵中的非0点,用item[num+1]来表示一个矩阵,至于为什么是num+1,这是因为item数组的首值为{行数,列数,非0值个数}结构,除首值外,其余值表示的矩阵中非0值的行列坐标以及其值

 

这种方式简单,但是记录单信息多(行列),每个三元组自己可以定位,因此空间不是最优。

(2) CSR存储(Compressed Sparse Row,压缩稀疏的行)

      CSR是比较标准的一种,也需要三类数据来表达:数值,列号,以及行偏移。数值和列号与COO一致,表示一个元素以及其列号,行偏移表示某一行的第一个元素在values里面的起始偏移位置。如上图中,第一行元素1是0偏移,第二行元素2是2偏移,第三行元素5是4偏移,第4行元素6是7偏移。在行偏移的最后补上矩阵总的元素个数

  • 23
    点赞
  • 87
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
稀疏矩阵压缩存储方法是一种优化矩阵存储空间的方法,它只存储非零元素及其对应的行列索引。常见的稀疏矩阵压缩存储方法有三种:COO(Coordinate),CSR(Compressed Sparse Row)和CSC(Compressed Sparse Column)。 1. COO(Coordinate)方法: COO方法是最简单的稀疏矩阵压缩存储方法,它将非零元素的值、行索引和列索引分别存储在三个数组中。例如,对于一个3x3的矩阵: ``` 1 0 0 0 2 0 0 0 3 ``` 使用COO方法进行压缩存储,可以得到以下三个数组: ``` values = [1, 2, 3] rows = [0, 1, 2] cols = [0, 1, 2] ``` 其中,values数组存储非零元素的值,rows数组存储非零元素的行索引,cols数组存储非零元素的列索引。 2. CSR(Compressed Sparse Row)方法: CSR方法是一种按行压缩存储稀疏矩阵方法。它使用三个数组来存储非零元素的值、列索引和行偏移量。行偏移量数组存储每一行的非零元素在values和cols数组中的起始位置。例如,对于上述的矩阵,使用CSR方法进行压缩存储,可以得到以下三个数组: ``` values = [1, 2, 3] cols = [0, 1, 2] row_offsets = [0, 1, 2, 3] ``` 其中,values数组和cols数组的含义与COO方法相同,row_offsets数组存储每一行的非零元素在values和cols数组中的起始位置。 3. CSC(Compressed Sparse Column)方法: CSC方法是一种按列压缩存储稀疏矩阵方法。它使用三个数组来存储非零元素的值、行索引和列偏移量。列偏移量数组存储每一列的非零元素在values和rows数组中的起始位置。例如,对于上述的矩阵,使用CSC方法进行压缩存储,可以得到以下三个数组: ``` values = [1, 2, 3] rows = [0, 1, 2] col_offsets = [0, 1, 2, 3] ``` 其中,values数组和rows数组的含义与COO方法相同,col_offsets数组存储每一列的非零元素在values和rows数组中的起始位置。 这三种稀疏矩阵压缩存储方法各有优缺点,选择哪种方法取决于具体的应用场景和对存储空间和计算效率的要求。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值