数据结构_第四章_数组和字符串

第四章 数组和字符串

4.1字符串存储
4.2模式匹配
4.3数组的逻辑结构特征
4.4数组的存储方式及寻址方法
4.5特殊矩阵和稀疏矩阵的压缩存储方法

4.1字符串存储

串的逻辑结构
串:零个或多个字符组成的有限序列。
串长度:串中所包含的字符个数。
空串:长度为0的串,记为:" "。
子串:串中任意个连续的字符组成的子序列。
主串:包含子串的串。
子串的位置:子串的第一个字符在主串中的序号。
串的存储结构
顺序串:用数组来存储串中的字符序列。
如何表示串的长度?
方案1:用一个变量来表示串的实际长度。
方案2:在串尾存储一个不会在串中出现的特殊字符作为串的终结符,表示串的结尾。
方案3:用数组的0号单元存放串的长度,从1号单元开始存放串值。
链接串:用链接存储结构来存储串。
如何改造链表实现串的链接存储?
(1)非压缩形式
(2)压缩形式

4.2模式匹配

模式匹配:
给定主串S="s1s2…sn"和模式T=“t1t2…tm”,
在S中寻找T 的过程称为模式匹配。
如果匹配成功,返回T 在S中的位置,如果匹配失败,返回-1。
模式匹配——BF算法

  1. 在串S和串T中设比较的起始下标i和j;
  2. 循环直到S或T的所有字符均比较完;
    2.1 如果S[i]==T[j],继续比较S和T的下一个字符;
    2.2 否则,将i和j回溯(i=i-j+1,j=0),准备下一趟比较;
  3. 如果T中所有字符均比较完,则匹配成功,返回匹配的起始比较下标(i-j);否则,匹配失败,返回-1
int BF(char S[ ], char T[ ])
{
     i=0; j=0;   
    while (i<S.Length()&&j<T.length())
    {
         if (S[i]==T[j]) {
             i++;   j++;
         }  
         else {
             i=i-j+1;    j=0;
         }   
     }
     if (j>=T.length())  return (i-j);   
     else return -1;
}

KMP算法
i可以不回溯,模式向右滑动到的新比较起点k ,并且k 仅与模式串T有关!
令k = next[ j ],则:
next[ j ]=-1 当j=0时 //不比较
=max { k | 0<k<j 且T0…Tk-1=Tj-(k-1) …Tj-1 }
=0 其他情况

int KMP_FindPat(char *s, char *t,int *next){
 int i=0,j=0,k;
 while(s[i]!='\0' && t[j]!='\0') {
  if(j==-1 || s[i]==t[j]) {
                 i++;
                 j++;
           }
  else
        j=next[j];
 }
 if(t[j]=='\0')
  return i-j;
 else
  return -1;
}

KMP算法用伪代码描述
1.在串S和串T中分别设比较的起始下标i和j;
2. 循环直到S中所剩字符长度小于T的长度或T中所有字符均比较完毕
2.1 如果S[i]==T[j],继续比较S和T的下一个字符;否则
2.2 将j向右滑动到next[j]位置,即j=next[j];
2.3 如果j=-1,则将i和j分别加1,准备下一趟比较;
3. 如果T中所有字符均比较完毕,则返回匹配的起始下标;否则返回-1;

4.3多维数组

数组是由一组类型相同的数据元素构成的有序集合,每个元素受n(n≥1)个线性关系的约束,并称该数组为 n 维数组。
数组的基本操作
⑴ 存取:给定一组下标,读出对应的数组元素;
⑵ 修改:给定一组下标,存储或修改与其相对应的数组元素。
存取和修改操作本质上只对应一种操作——寻址
数组的存储结构与寻址——一维数组
设一维数组的下标的范围为闭区间[l,h],每个数组元素占用 c 个存储单元,则其任一元素 ai 的存储地址可由下式确定:
Loc(ai)=Loc(al)+(i-l)×c
数组的存储结构与寻址——二维数组
按行优先存储的寻址
aij前面的元素个数
=整行数×每行元素个数+本行中aij前面的元素个数
=(i -l1)×(h2 -l2+1)+(j -l2)
Loc(aij)=Loc(al1l2)+((i-l1)×(h2-l2+1)+(j-l2))×c
列优先存储的寻址
a[i][j]的存储地址:
LOC ( i, j ) = a + ( j *n +i ) * l

4.4 矩阵的压缩存储

特殊矩阵和稀疏矩阵
特殊矩阵:矩阵中很多值相同的元素并且它们的分布有一定的规律。
稀疏矩阵:矩阵中有很多零元素。
压缩存储的基本思想是:
⑴ 为多个值相同的元素只分配一个存储空间;
⑵ 对零元素不分配存储空间。
对称矩阵的压缩存储
aij在一维数组中的序号
= i×(i-1)/2+ j
一维数组下标从0开始
aij在一维数组中的下标
k= i×(i-1)/2+ j-1
对于下三角中的元素aij(i≥j), 在一维数组中的下标k与i、j的关系为:
k=i×(i-1)/2+j-1 。
上三角中的元素aij(i<j),因为aij=aji,则访问和它对应的元素aji即可,即:
k=j×(j-1)/2+i -1。
特殊矩阵的压缩存储——对角矩阵 (带状矩阵)
对角矩阵 (带状矩阵)压缩存储方法一 :二维数组法
以行序为主序,
aij在一维数组中的地址k?
k=(3*(i-1)-1)+(j-i+1)
k=2i+j-3
稀疏矩阵的压缩存储
将稀疏矩阵中的每个非零元素表示为:
(行号,列号,非零元素值)——三元组
稀疏矩阵的压缩存储——三元组顺序表

存储结构定义:
    const int MaxTerm=100;
    template <class T>
    struct SparseMatrix
    {
       T data[MaxTerm];   //存储非零元素
       int mu, nu, tu;          //行数,列数,非零元个数
    };
4.5 广义表

广义表(列表): n (  0 )个表元素组成的有限序列,记作:
LS = (a0, a1, a2, …, an-1)
LS是表名,ai是表元素,它可以是表 (称为子表),可以是数据元素(称为原子)。
n为表的长度。n = 0 的广义表为空表。
长度:广义表LS中的直接元素的个数;
深度:广义表LS中括号的最大嵌套层数。
表头:广义表LS非空时,称第一个元素为LS的表头;
表尾:广义表LS中除表头外其余元素组成的广义表。
广义表的存储结构——头尾表示法
tag:区分表结点和元素结点的标志;
hp:指向表头结点的指针;
tp:指向表尾结点的指针;
data:数据域,存放单元素
广义表的特点
有次序性
有长度
有深度
可递归
可共享

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值