一、字符串
(一)、串的逻辑结构
串:零个或多个字符组成的有限序列。串长度:串中所包含的字符个数。空串:长度为0的串,记为:" "。子串:串中任意个连续的字符组成的子序列。主串:包含子串的串。子串的位置:子串的第一个字符在主串中的序号。
(二)、串的存储结构
顺序串:用数组来存储串中的字符序列。链接串:用链接存储结构来存储串。
(三)、模式匹配
模式匹配:给定主串S="s1s2…sn"和模式T="t1t2…tm",在S中寻找T 的过程称为模式匹配。
BF算法
1. 在串S和串T中设比较的起始下标i和j;2. 循环直到S或T的所有字符均比较完;如果S[i]==T[j],继续比较S和T的下一个字符;否则,将i和j回溯(i=i-j+1,j=0),准备下一趟比较;3. 如果T中所有字符均比较完,则匹配成功,返回匹配的起始比较下标(i-j);否则,匹配失败,返回-1;
int BF(char S[ ], char T[ ])
{
i=0; j=0;
while (i<S.Length()&&j<T.length())
{
if (S[i]==T[j]) {
i++; j++;
}
else {
i=i-j+1; j=0;
}
}
if (j>=T.length()) return (i-j);
else return -1;
}
KMP算法
1.在串S和串T中分别设比较的起始下标i和j;2. 循环直到S中所剩字符长度小于T的长度或T中所有字符均比较完毕;如果S[i]==T[j],继续比较S和T的下一个字符;否则将j向右滑动到next[j]位置,即j=next[j];如果j=-1,则将i和j分别加1,准备下一趟比较; 3. 如果T中所有字符均比较完毕,则返回匹配的起始下标;否则返回-1;
void Compute_Next(char t[], int next[])
{
int j,k;
next[0]=-1;j=1;
while(t[j]!='\0')
{
k=next[j-1];
while((k!=-1)&&(t[k]!=t[j-1]))
k=next[k];
next[j]=++k;
j++;
}
}
int KMP_FindPat(char *s, char *t,int *next){
int i=0,j=0,k;
while(s[i]!='\0' && t[j]!='\0') {
if(j==-1 || s[i]==t[j]) {
i++;
j++;
}
else
j=next[j];
}
if(t[j]=='\0')
return i-j;
else
return -1;
}
二、多维数组
(一)、数组
数组的定义:数组是由一组类型相同的数据元素构成的有序集合,每个元素受n(n≥1)个线性关系的约束,并称该数组为 n 维数组。
数组的特点:元素本身可以具有某种结构,属于同一数据类型;数组是一个具有固定格式和数量的数据集合。
二维数组是数据元素为线性表的线性表。
(二)、数组的存储结构与寻址
设一维数组的下标的范围为闭区间[l,h],每个数组元素占用 c 个存储单元,则其任一元素 ai 的存储地址可由下式确定:Loc(ai)=Loc(al)+(i-l)×c。
按行优先存储的基本思想是:最右边的下标先变化,即最右下表从小到大,循环一遍后,右边第二个下标再变,……最后是最左下标。
按列优先存储的基本思想恰好相反:最左边的下标先变化,即最左下标从小到大,循环一遍后,左边第二个下标再变,……最后是最右下标。
(三)、矩阵的压缩存储
特殊矩阵:矩阵中很多值相同的元素并且它们的分布有一定的规律。
稀疏矩阵:矩阵中有很多零元素。
压缩存储的基本思想是:
⑴ 为多个值相同的元素只分配一个存储空间;
⑵ 对零元素不分配存储空间。
对称矩阵的压缩存储
对称矩阵关于主对角线对称,因此只需存储下三角部分即可。这样,原来需要n*n个存储单元,现在只需n*(n+1)/2个存储单元,节约了大约一半的存储单元。当n较大时,这是客观的一部分存储单元。
三角矩阵的压缩存储
下三角矩阵的压缩存储与对称矩阵类似,不同之处仅在于存储下三角中的元素以外,还要存储对角线上方的常数。因为是同一个常数,所以只存储一个即可。这样,共存储n*(n+1)/2+1个元素,将其按行优先存入数组SA[n*(n+1)/2+1]中。
下三角矩阵中任一元素a(ij)在SA中的下标k与i、j的对应关系为:当i>=j时,k=i*(i-1)/2+j-1;当i<j时,k=n*(n+1)2;
同理,上三角矩阵中任一元素a(ij)在SA中的下标k与i、j对应关系为:当i<=j时,k=(i-1)*(2n-i+2)/2+j-i;当i>j时,k=n*(n+1)/2
对角矩阵的压缩存储
在对角矩阵中,所有非零元素都集中在以主对角线为中心的带状区域,除了主对角线和他的上下若干条主对角线的元素外,所有其他元素都为零。因此,对角矩阵也称为带状矩阵。
对于一个m*n的w对角矩阵(w是占有非零元素的对角线的个数,也称带宽),一种压缩方法是将其压缩到一个m行w列的二维数组B中,则a(ij)映射为b(ts),其映射关系为:(1) t=i;(2) s=j-i+2
稀疏矩阵的压缩存储
将稀疏矩阵的非零元素对应的三元组成所构成的集合,按行优先的顺序排列成一个线性表,称为三元组表,则稀疏矩阵的压缩存储转化为三元组表的存储。
1. 三元组顺序表
采用顺序存储结构存储的三元组表称为三元组顺序表。显然,要唯一表示一个稀疏矩阵,还需要在存储三元表的同时存储该矩阵的行数、列数和非零元素的个数,其存储结构定义如下:
const int MaxTerm=100;
struct Sparsematrix
{
elementdata [MaxTerm];
intmu,nu,tu;
};
2. 十字链表
稀疏矩阵的链接存储结构称为十字链表。它具备存储结构的特点,因此,在非零元素的个数及位置都会发生变化的情况下,通常采用十字链表存储稀疏矩阵。
十字链表存储稀疏矩阵的基本思想是:将每个非零元素对应的三元组存储为一个链接表结点,节点由5个域组成。
struct OrthNode
{
element data;
struct OrthNode *right,*down;
};