1.串的顺序存储结构
# define MAXLEN 255
typedef struct{
char ch[MAXLEN+1];
int length;
}SString;
2.串的链式存储结构——块链结构
因为传统的链式结构存储密度低,可以将多个字符存放在一个结点中,以客服其缺点,称为块链结构。
#define CHUNKSIZE 80
typedef struct Chunk{
char ch[CHUNKSIZE];
struct Chunk *next;
}Chunk;
typedef struct{
Chunk *head,*tail;
int curlen;
}LString;
3.串的模式匹配算法
算法目的:确定主串中所含(模式串)第一次出现的位置
算法应用:搜索引擎、拼写检查、语言翻译、数据压缩
算法种类:BF算法,KMP算法。
Brute-Force 简称为BF算法,也称为简单匹配算法,采用穷举法的思路
举例:
BF算法设计思想:
Index(S,T,pos)
将主串的第pos个字符和模式串的第一个字符比较;
若相等,继续逐个比较后续字符
若不等,从主串的下一字符起,重新与模式串的第一个字符比较。
直到主串的一个连续子串字符序列与模式串相等。返回值为S中与T匹配的子序列第一个字符的序号,即匹配成功。 否则,匹配失败,返回值为0。
int Index_BF(SString S,SString T){
int i=1,j=1;
while(i<=S.length&&j<=T.length){
if(s.ch[i]==t.ch[j]){
++i;++j;
}
else{i=i-j+2;j=1;}
}
if(j>=T.length return i-T.length;)
else return 0; //匹配不成功
}
算法时间复杂度:
KMP算法
思想:利用已经部分匹配的结果而加快模式串的滑动速度,且主串S的指针i不必回溯
这里需要定义一个next[j] 函数,表明当模式中第j个字符串与主串中相应字符“失配”时,在模式中需要重新和主串中该字符进行比较的字符的位置。
代码表示:
int Index_KMP(SString S,String T,int pos){
i=pos,j=1;
while(i<S.length && j<T.length){
if(j==0||S.ch[i]==T.ch[j]){i++;j++}
else
j=next[j]; //i不变,j后退
}
if(j>T.length)
return i-T.length; //匹配成功;
else return 0;
}
next函数的改进:nextval
代码:
void get_nextval(SString T,int &nextval[]){
i=1;nextval[1]=0;j=0;
while(i<T.length){
if(j==0||T.ch[i]==T.ch[j]){
++i;++j;
if(T.ch[i]!=T.ch[j])nextval[i]=j;
else nextval[i]=nextval[j];
}
else j=nextval[j];
}
}