串的定义
串时由零个或多个字组成的有限序列 又名字符串
一般记为s=“a1a2…an"(n>=0)其中串名是s n是串的长度 灵感字符数目n称为空串。
空格串:不是空串,可以不止一个空格
子串与主串:子串在主串的位置就是子串的第一个字符在主串中的序号
串的比较
通过ASCII编码进行比较
当且仅当 n=m a1=b1,a2=b2,…an=bn时 s=t
给定两个串 当满足一下条件之一时 s<t
n<m 且ai=bi(i=1,2,3,4…n)
存在某个k<=min(m,n),使得a1=b1(i=1,2,…k-1) ak<bk.
串的抽象数据类型
ADT 串(string)
Data
Operation
StrAssign(T,*chars): 生成一个其值等于字符串常量chars的串T
StrCopy(T,S):S存在 将串清空
StringEmpty(S):串S存在 将串清空
StrLength(S):返回S元素的个数 即串的长度
StrCompare(S,T): 若S>T 返回值>0 = 0 < <0
Concat(T,S1,S2):将S1 S2 连接起来
SubString(sub,S,pos,len) :串S存在 l<=pos<=StrLrngth(S)
Index(S,T,pos):返回相同地方的位置 否则为0
Replace(S,T,V):T为非空 用V替换主串S中出现的所有与T相等的不重叠的子串
StrInsert(S,pos,T):c串S和T存在 1<=pos<=StrLength(S)+1
串的存储结构
串的存储结构与线性表相同
串的顺序存储空间在程序指向过程中动态分配而得。堆 用malloc() free() 来管理。
朴素的模式匹配算法
字串的定位操作通常称作串的模式匹配。
对朱传的每一个字符作为子串开头,要与匹配的字符串进行匹配。
KMP模式匹配算法
大大避免重复
快速从主串中找到子串
指针左右匹配 有无公共前后缀 找最长的公共前后缀
1.移动模式串 前缀移动到后缀
多对公共前后缀 要最后一串 直到超出范围 就是没有匹配的
之研究模式串就行
将模式串放在数组 1开始
等于当前最大公共前后缀+1
总结 T串的首字符与后面字符的比较,发现如果有相等字符,j值得变化就不同。也就是说这个j值得变化与主串其实没什么关系,关键在于T串得结构中是否由重复问题。
T串各个位置得j值得变化定义为一个数组next next得长度就是T得长度
0,当j=1时
next[j]=Max{k|1<k<j 且一段是相等的}当此集合不为空时
1,其他情况
计算例题P140
//通过计算返回子串T的next数组
void get_next(String T,int *next)
{
int i,j;
i=1;
j=0;
next[1]=0;
while(i<T[0])
{
if(j==0||T[i]==T[j])
{
++i;
++j;
next[i]=j;
}
else
j=next[j];//如果字符不相同则j值回溯
}
}
计算next数组
//返回子串T在主串S的第pos个字符后的位置
//T非空 1<pod<=StrLength(S)
int index_KMP(String S,String T, int pos)
{
int i=pod;
int j=1;
int next[255];
get_next(T,next);
while(i<=S[0]&&j<=T[0])
{
if(j==0||S[i]==T[j])
{
++i;
++j;
}
else
{
j=next[i];
}
}
if(j>T[0])
return i-T[0];
else
return 0;
}