数据结构之数组和广义表_实现数组和广义表的建立-CSDN博客

本文链接：https://blog.csdn.net/m0_51143578/article/details/129967158

文章介绍了数组的定义、顺序表示和实现，特别是二维数组在内存中的存储方式，包括行优先顺序和列优先顺序。接着讨论了矩阵的压缩存储，重点讲解了对称矩阵、三角矩阵和对角矩阵的存储优化。最后，提到了稀疏矩阵的概念和压缩存储方法，以及稀疏矩阵转置的算法。

摘要由CSDN通过智能技术生成

文章目录

第5章数组和广义表

第5章数组和广义表

科学计算中涉及到大量的矩阵问题，在程序设计语言中一般都采用数组来存储，被描述成一个二维数组。但当矩阵规模很大且具有特殊结构(对角矩阵、三角矩阵、对称矩阵、稀疏矩阵等)，为减少程序的时间和空间需求，采用自定义的描述方式。

5.1 数组的定义

数组是由 $n (n > 1)$ 个具有相同数据类型的数据元素 $a_1，a_2，…，a_n$ 组成的有序序列，且该序列必须存储在一块地址连续的存储单元中。

在这里插入图片描述

5.2 数组的顺序表示和实现

数组一般不做插入和删除操作，也就是说，数组一旦建立，结构中的元素个数和元素间的关系就不再发生变化。因此，一般都是采用顺序存储的方法来表示数组。

问题：计算机的内存结构是一维(线性)地址结构，对于多维数组，将其存放(映射)到内存一维结构时，有个次序约定问题。

二维数组是最简单的多维数组，以此为例说明多维数组存放(映射)到内存一维结构时的次序约定问题。

通常有两种顺序存储方式

行优先顺序(Row Major Order) ：将数组元素按行排列，第 $i + 1$ 个行向量紧接在第 $i$ 个行向量后面。对二维数组，按行优先顺序存储的线性序列为：

$a 11, a 12, \dots, a 1 n, a 21, a 22, \dots a 2 n, \dots\dots, am 1, am 2, \dots, amn$

列优先顺序(Column Major Order) ：将数组元素按列向量排列，第 $j + 1$ 个列向量紧接在第 $j$ 个列向量之后，对二维数组，按列优先顺序存储的线性序列为：

$a 11, a 21, \dots, am 1, a 12, a 22, \dots am 2, \dots\dots, an 1, an 2, \dots, anm$

设有二维数组 $A=(a_{ij})_{m\times n}$ ，若每个元素占用的存储单元数为 $l$ (个)， $LOC[a_{11}]$ 表示元素 $a_{11}$ 的首地址，即数组的首地址。

以“行优先顺序”存储存储

(1) 第1行中的每个元素对应的(首)地址是：

$LOC[a_{1j}]=LOC[a_{11}]+(j-1)\times l \quad j=1,2, …,n$

(2) 第2行中的每个元素对应的(首)地址是：

$LOC[a_{2j}]=LOC[a_{11}]+n\times l+(j-1)\times l \quad j=1,2, …,n$

(3) 第 $m$ 行中的每个元素对应的(首)地址是：

$LOC[a_{mj}]=LOC[a_{11}]+(m-1)\times n\times l+(j-1)\times l \quad j=1,2, …,n$

由此可知，二维数组中任一元素 $a_{ij}$ 的(首)地址是：

$LOC[a_{ij}]=LOC[a_{11}]+[(i-1) \times n+(j-1)] \times l \\ \text{}\\ i=1,2, …,n \quad j=1,2, …,m$

对于三维数组 $A=(a_{ijk})_{m\times n\times p}$ ，若每个元素占用的存储单元数为 $l$ (个)，三维数组中任一元素 $a_{ijk}$ 的(首)地址是：

$LOC(a_{ijk})=LOC[a_{111}]+[(i-1)\times n\times p+(j-1)\times p+(k-1)]\times l$

$n$ 维数组中任一元素 $a_{j_1j_2…j_n}$ 的(首)地址是：

$\begin{aligned} \operatorname{ LOC}[a_{j_1j_2\dots j_n }]&=\operatorname{ LOC}[a_{11\dots1}]\\ &+[(b2\times\dots\times b_n)\times(j_1-1)\\ &+[(b3\times\dots\times b_n)\times(j_2-1)+\dots\\ &+b_n\times (j_{n-1}-1)+j_n-1]\times l \end{aligned}$

以“列优先顺序”存储

略

5.3 矩阵的压缩存储

5.3.1 特殊矩阵

对称矩阵

若一个 $n$ 阶方阵 $A=(a_{ij})_{n\times n}$ 中的元素满足性质：
$a_{ij}=a_{ji} \quad 1\le i,j\le n \quad \operatorname{and} \quad i \ne j$

则称 $A$ 为对称矩阵。

在这里插入图片描述

对称矩阵中的元素关于主对角线对称，因此，让每一对对称元素 $a_{ij}$ 和 $a_{ji}(i≠j)$ 分配一个存储空间，则 $n^2$ 个元素压缩存储到 $n (n + 1) /2$ 个存储空间，能节约近一半的存储空间。

不失一般性，假设按“行优先顺序”存储下三角形(包括对角线)中的元素。

设用一维数组(向量) $s a [0 \dots n (n + 1) /2 - 1]$ 存储 $n$ 阶对称矩阵，如图5-4所示。为了便于访问，必须找出矩阵 $A$ 中的元素的下标值 $（ i, j ）$ 和向量 $s a [k]$ 的下标值 $k$ 之间的对应关系。

对称矩阵元素 $a_{ij}$ 保存在向量 $s a$ 中的下标值 $k$ 与 $（ i, j ）$ 之间的对应关系是：
$k=\left\{\begin{array}{ll} i \times(i-1) / 2+j-1 & \text { 当 } i \ge j \text { 时 } \\ j \times(j-1) / 2+i-1 & \text { 当 } i<j \text { 时 } \end{array} \quad 1 \le i, j \le n\right.$
2. 三角矩阵

以主对角线划分，三角矩阵有上三角和下三角两种。

上三角矩阵的下三角（不包括主对角线）中的元素均为常数c(一般为0)。下三角矩阵正好相反，它的主对角线上方均为常数

三角矩阵中的重复元素 $c$ 可共享一个存储空间，其余的元素正好有 $n (n + 1) /2$ 个，因此，三角矩阵可压缩存储到向量 $s a [0 \dots n (n + 1) /2]$ 中，其中 $c$ 存放在向量的第 1 个或最后１个分量中。

在这里插入图片描述

3.对角矩阵

在这里插入图片描述

矩阵中，除了主对角线和主对角线上或下方若干条对角线上的元素之外，其余元素皆为零。即所有的非零元素集中在以主对角线为了中心的带状区域中，如图5-6所示。

在这里插入图片描述

如上图三对角矩阵，非零元素仅出现在主对角( $a_{i, i},1\le i\le n$ )上、主对角线上的那条对角线( $a_{i, i+1},1\le i\le n-1$ ) 、主对角线下的那条对角线上( $a_{i+1, i},1\le i\le n-1$ )。显然，当 $∣ i - j ∣ > 1$ 时，元素 $a_{ij}=0$

对角矩阵可按行优先顺序或对角线顺序，将其压缩存储到一个向量中，并且也能找到每个非零元素和向量下标的对应关系。

对这种矩阵，当以按“行优先顺序”存储时，第 $1$ 行和第 $n$ 行是 $2$ 个非零元素，其余每行的非零元素都要是 $3$ 个，则需存储的元素个数为 $3 n - 2$ 。

在这里插入图片描述

5.3.2 稀疏矩阵

稀疏矩阵(Sparse Matrix)：对于稀疏矩阵，目前还没有一个确切的定义。设矩阵A是一个 $m\times n$ 的矩阵中有s个非零元素，设 $δ=s/(m\times n)$ ，称 $δ$ 为稀疏因子，如果某一矩阵的稀疏因子 $δ$ 满足 $δ\le 0.05$ 时称为稀疏矩阵，如图5-8所示。

$A=\left(\begin{array}{cccccccc} 0 & 12 & 9 & 0 & 0 & 0 & 0 & 0 \\ 0 & 0 & 0 & 0 & 0 & 0 & 0 & 0 \\ -3 & 0 & 0 & 0 & 0 & 0 & 0 & 4 \\ 0 & 0 & 24 & 0 & 0 & 2 & 0 & 0 \\ 0 & 18 & 0 & 0 & 0 & 0 & 0 & 0 \\ 0 & 0 & 0 & 0 & 0 & 0 & -7 & 0 \\ 0 & 0 & 0 & -6 & 0 & 0 & 0 & 0 \end{array}\right)$

对于稀疏矩阵，采用压缩存储方法时，只存储非0元素。必须存储非0元素的行下标值、列下标值、元素值。因此，一个三元组 $i, j, a_{ij})$ 唯一确定稀疏矩阵的一个非零元素。

如图5-8的稀疏矩阵A的三元组线性表为：
$((1, 2, 12), (1, 3, 9), (3, 1, - 3), (3, 8, 4), (4, 3, 24), (4, 6, 2), (5, 2, 18), (6, 7, - 7), (7, 4, - 6))$

typedef struct
{
    int rn; /*   行数   */
    int cn; /*   列数   */
    int tn; /*    非0元素个数   */
    Triple data[MAX_SIZE];
} TMatrix;

求转置矩阵的基本算法思想是：

方法一：
算法思想：按稀疏矩阵A的三元组表a.data中的列次序依次找到相应的三元组存入b.data中。

① 将矩阵的行、列下标值交换。即将三元组表中的行、列位置值i 、j相互交换；

② 重排三元组表中元素的顺序。即交换后仍然是按行优先顺序排序的。

void TransMatrix(TMatrix a, TMatrix &b)
{
    int p, q, col;
    b.rn = a.cn;
    b.cn = a.rn;
    b.tn = a.tn;
    /*    置三元组表b.data的行、列数和非0元素个数 */
    if (b.tn == 0)
        printf(“ The Matrix A = 0\n”);
    else
        　/* 仔细结合P98图 */
        {
            q = 1;
            for (col = 1; col <= a.cn; col++)
                /* 每循环一次找到转置后行号为col的若干三元组  */
                for (p = 1; p <= a.tn; p++)
                    /*   循环次数是第col行中非0元素个数   */
                    if (a.data[p].col == col)
                    {
                        b.data[q].row = a.data[p].col;
                        b.data[q].col = a.data[p].row;
                        b.data[q].value = a.data[p].value;
                        q++; /*表示下次要交换的三元组*/
                    }
        }
}

当非零元素的个数tn和 $m\times n$ 同数量级时，算法TransMatrix的时间复杂度为 $O(m\times n^2)$ 。

而一般传统矩阵的转置算法为：

for (col = 1; col <= n; ++col)
    for (row = 0; row <= m; ++row)
        b[col][row] = a[row][col];

其时间复杂度为 $O(m\times n)$ 。

方法二:

(快速转置的算法)

$\begin{array}{|c|c|c|c|c|c|c|c|c|} \hline \text { col } & 1 & 2 & 3 & 4 & 5 & 6 & 7 & 8 \\ \hline \text { num }[\text { col }] & 1 & 2 & 2 & 1 & 0 & 1 & 1 & 1 \\ \hline \text { cpot }[\mathrm{col}] & 1 & 2 & 4 & 6 & 7 & 7 & 8 & 9 \\ \hline \end{array}$

显然有位置对应关系：

$\left\{\begin{array}{l} \operatorname{cpot}[1]=1 \\ \operatorname{cpot}[\operatorname{col}]=\operatorname{cpot}[\operatorname{col}-1]+\text { num }[\operatorname{col}-1] \quad 2 \leq \operatorname{col} \leq a \cdot c n \end{array}\right.$

void FastTransMatrix(TMatrix a, TMatrix &b)
{
    int p, q, col, k;
    int num[MAX_SIZE], copt[MAX_SIZE];
    /*   置三元组表b.data的行、列数和非0元素个数  */
    b.rn = a.cn;
    b.cn = a.rn;
    b.tn = a.tn;
    
    if (b.tn == 0)
        printf(“The Matrix A = 0\n”);
    else
    {
        for (col = 1; col <= a.cn; ++col)
            num[col] = 0;
        /*  向量num[]初始化为0   */
        for (k = 1; k <= a.tn; ++k)
            ++num[a.data[k].col] /*   求原矩阵中每一列非0元素个数  结合课本９８－９９表*/

        for (cpot[1] = 1, col = 2; col <= a.cn; ++col)
            cpot[col] = cpot[col - 1] + num[col - 1];
        /*  求第col列中第一个非0元在b.data中的序号 */

        for (p = 1; p <= a.tn; ++p) /*处理a的第p个元素*/
        {
            col = a.data[p].col;
            q = cpot[col];
            b.data[q].row = a.data[p].col;
            b.data[q].col = a.data[p].row;
            b.data[q].value = a.data[p].value;
            ++cpot[col]; /*至关重要!!当本列中有多个元素，下一元素位置加一*/
        }
    }
}

5.4 广义表

在第2章中，我们把线性表定义为 $n(n\ge 0 )$ 个元素 $a 1, a 2, \dots, an$ 的有穷序列，该序列中的所有元素具有相同的数据类型且只能是原子项(Atom)。所谓原子项可以是一个数或一个结构，是指结构上不可再分的。若放松对元素的这种限制，容许它们具有其自身结构，就产生了广义表的概念。

广义表(Lists，又称为列表 )：是由 $\ge 0)$ 个元素组成的有穷序列： $L S = (a 1 ， a 2 ， \dots ， an)$

习惯上：原子用小写字母，子表用大写字母。

若广义表LS非空时：

其余元素组成的子表称为表尾；(a2，a3，…，an)
广义表中所包含的元素(包括原子和子表)的个数称为表的长度。
广义表中括号的最大层数称为表深 (度)。
广义表中括号第一层的元素个数称为表长
$a 1$ (表中第一个元素)称为表头；

根据对表头、表尾的定义，任何一个非空广义表的表头可以是原子，也可以是子表，而表尾必定是广义表。

$\begin{array}{|l|c|c|} \hline \text { 广义表 } & \text { 表长n } & \text { 表深h } \\ \hline \mathbf{A}=() & 0 & 1 \\ \hline \mathbf{B}=(e) & 1 & 1 \\ \hline \mathbf{C}=(a,(b, c, d)) & 2 & 2 \\ \hline \mathbf{D}=(\mathbf{A}, \mathbf{B}, \mathbf{C}) & 3 & 3 \\ \hline \mathbf{E}=(a, \mathbf{E}) & 2 & \infty \\ \hline \mathbf{F}=(()) & 1 & 2\\ \hline \end{array}$

5.4.1 广义表的存储结构

由于广义表中的数据元素具有不同的结构，通常用链式存储结构表示，每个数据元素用一个结点表示。因此，广义表中就有两类结点：

◆ 一类是表结点，用来表示广义表项，由标志域，表头指针域，表尾指针域组成;
◆ 另一类是原子结点，用来表示原子项，由标志域，原子的值域组成。如图5-13所示。

只要广义表非空，都是由表头和表尾组成。即一个确定的表头和表尾就唯一确定一个广义表。

在这里插入图片描述

typedef struct GLNode
{
    int tag; /*  标志域，为1：表结点;为0 ：原子结点  */
    union
    {
        elemtype value; /* 原子结点的值域  */
        struct
        {
            struct GLNode *hp, *tp;
        } ptr; /*  ptr和atom两成员共用  */
    };
} *GList; /* 广义表类型  */