一、串的逻辑结构
(一)字符串的定义
1、串:零个或多个字符组成的有限序列。
2、串长度:串中所包含的字符个数。
3、空串:长度为0的串,记为:" “。
非空串通常记为:
S=” s1 s2 …… sn "
其中:S是串名,双引号是定界符,双引号引起来的部分是串值 ,si(1≤i≤n)是一个任意字符。
4、子串:串中任意个连续的字符组成的子序列。
5、主串:包含子串的串。
6、子串的位置:子串的第一个字符在主串中的序号。
Eg:
S1="ab12cd "
S2=“ab12”
S3=“ab13”
(二)串的长度
1、用一个变量来表示串的实际长度。
2、在串尾存储一个不会在串中出现的特殊字符作为串的终结符,表示串的结尾。
3、用数组的0号单元存放串的长度,从1号单元开始存放串值。
(三)改造链表实现串的链接存储
1、非压缩形式
2、压缩形式
(四)模式匹配
1、定义:给定主串S="s1s2…sn"和模式T=“t1t2…tm”,在S中寻找T 的过程称为模式匹配。
2、模式匹配的应用包括生物信息学(基因表达分析,基因配对)、信息检索、拼写检查、语言翻译、数据压缩、网络入侵检测。
3、BF算法:从主串S的第0个字符开始和模式T 的第0个字符进行比较,
若相等,则继续比较两者的后续字符;
否则,从主串S的第1个字符开始和模式T 的第0个字符进行比较, 重复上述过程,直到T 中的字符全部比较完毕,则说明本趟匹配成功;或S中字符全部比较完,则说明匹配失败。
int BF(char S[ ], char T[ ])
{
i=0; j=0;
while (i<S.Length()&&j<T.length())
{
if (S[i]==T[j]) {
i++; j++;
}
else {
i=i-j+1; j=0;
}
}
if (j>=T.length()) return (i-j);
else return -1;
}
(五)KMP算法
int KMP_FindPat(char *s, char *t,int *next){
int i=0,j=0,k;
while(s[i]!='\0' && t[j]!='\0') {
if(j==-1 || s[i]==t[j]) {
i++;
j++;
}
else
j=next[j];
}
if(t[j]=='\0')
return i-j;
else
return -1;
}