本章节主要内容:
- 字符串存储
- 模式匹配
- 数组的逻辑结构特征
- 数组的存储方式及寻址方法
- 特殊矩阵和稀疏矩阵的压缩存储方法
一、字符串
1、串:零个或多个字符组成的有限序列。
串长度:串中所包含的字符个数。
空串:长度为0的串,记为“ ”。
非空串表示:S=”s1,s2…sn"(S为串名,“”为定界符,其中为串值,si为任意字符。
2、串的逻辑结构
顺序串:用数组来存储串中的字符序列。
表示串的长度:
-
用一个变量来表示串的实际长度。
-
在串尾存储一个不会在串中出现的特殊字符作为串的终结符,表示串的结尾。
-
用数组的0号单元存放串的长度,从1号单元开始存放串值。
链接串:用链接存储结构来存储串。
改造链表实现串的链接存储: -
非压缩形式
-
压缩形式
3、模式匹配
①给定主串S="s1s2…sn"和模式T=“t1t2…tm”,在S中寻找T的过程。——如果匹配成功,返回T在S中的位置,如果匹配失败,返回-1。假设串采用顺序存储结构,串值从0号单元开始存放。
②应用:生物信息学(基因表达分析,基因配对)、信息检索、拼写检查、语言翻译、数据压缩、网络入侵检测
③BF(Brute-Force)算法:
从主串S的第0个字符开始和模式T的第0个字符进行比较,若相等,则继续比较两者的后续字符;否则从主串S的第1个字符开始和模式T的第0个字符进行比较,重复,直到T中的字符全部比较完毕,则说明本趟匹配成功;或S中字符全部比较完,则说明匹配失败。
⭐模式匹配过程要进行多趟的匹配,每趟匹配要进行若干次的比较
int BF(char S[],char T[])
{
i=0;j=0;
while(i<S.Length()&&j<T.length())
{
if(S[i]==T[j]){
i++;j++;
}
else{
i=i-j+1;j=0;
}
}
if(j>=T.length()) return(i-j);
else return -1;
}
设串S长度为n,串T长度为m,在匹配成功的情况下,考虑:
- 最好:不成功的匹配都发生在串T的第一个字符。例如:S=“aaaaaaaaaabcdccccc”,T=“bcd”
- 最坏:不成功的匹配都发生在串T的最后一个字符。例如:S=“aaaaaaaaaabccccc”,T=“aaab”
④KMP(Knuth-Morris-Pratt)算法
i可以不回溯,模式向右滑动到的新比较起点k,并且k仅与模式串T有关。
next【j】表征着模式T中最大相同前缀子串和左子串(真子串)的长度。
void Compute_Next(char t[],int next[])
{
int j,k;
next[0]=-1;j=1;
while(t[j]!=’\0’)
{
k=next[j-1];
while((k!=-1)&&(t[k]!=t[j-1]))
k=next[k];
next[j]=++k;
j++;
}
}
用伪代码描述:
- 在串S和串T中分别设比较的起始下标i和j;
2.循环直到S中所剩字符长度小于T的长度或T中所有字符均比较完毕
①如果S[i]==T[j],继续比较S和T的下一个字符;否则
②将j向右滑动到next【j】位置,即j=next【j】;
③如果j=1,则将i和j分别加1,准备下一趟比较;
3.如果T中所有字符均比较完毕,则返回匹配的起始下标;否则返回-1。
三、多维数组
1、数组的定义:数组是由一组类型相同的数据元素构成的有序集合,每个元素受n(n≥1)个线性关系的约束,并称该数组为n维数组。
2、元素本身可以具有某种结构,属于同一数据类型;
数组是一个具有固定格式和数量的数据集合。
3、线性表的推广:
二维数组是数据元素为线性表的线性表。
4、数组的基本操作:
①存取
②修改
存取和修改操作本质上只对应一种操作——寻址
⭐顺序存储
5、数组的存储结构与寻址——二维数组
常用的映射方法:
①按行优先:先行后列
aij前面的元素个数
=整行数每行元素个数+本行中aij前面的元素个数
=(i-l1)(h2-l2+1)+(j-l2)
②按列优先:先列后行
四、矩阵的压缩存储
1、特殊矩阵和稀疏矩阵
压缩存储的基本思想:
①为多个值相同的元素只分配一个存储空间;
②对零元素不分配存储空间
2、对称矩阵、对角矩阵
3、三元组顺序表
稀疏矩阵的修改操作->三元组顺序表的插入/删除操作
4、存储结构定义:
const int MaxTerm=100;
template
struct SparseMatrix
{
T data[MaxTerm];//存储非零元素
int mu,nu,tu;/行数,列数,非零元个数
};
五、广义表
LS=(a0,a1,a2,…,an-1)
1、广义表与线性表的区别
①线性表的成分都是结构上不可分的氮元素
②广义表的成分可以是单元素,也可以是有结构的表
③线性表是一种特殊的广义表
④广义表不一定是线性表,也不一定是线性结构
2、广义表的基本运算
①求表头GetHead(L)
②求表尾GetTail(L)
3、广义表的存储
不能用顺序存储结构
用头尾表示法