只是我自己看书、视频的总结 可能不适合其他人看。
串
串(string)是有零个或多个字符组成的有限序列,有名叫字符串。
空格串和空串不一样,空格串是有内容有长度的,而且可以不止一个空格。
线性表更关注的是单个元素的操作,比如查找一个元素,插入或删除一个元素,但串中更多的是查找子串位置、得到指定位置子串、替换子串等操作。
串的抽象数据类型
ADT 串(string)
Data
串中元素仅由一个字符组成,相邻元素具有前驱和后继关系。
Operation
StrAssign(T, *chars):生成一个其值等于字符串常量chars的串T。
StrCopy(T,S):串S存在,由串S复制得串T。
ClearString(S):串S存在,将串S清空。
StringEmpty(S):若串S为空,返回true,反之返回false。
StrLength(S):返回串S的元素个数,即串的长度。
StrCompare(S, T):若S>T, 返回值>0,相等返回0,若S<T,返回值小于0。
Concat(T, S1, S2): 用T返回由S1和S2连接而成的新串。
SubString(Sub, S,pos,len):串S存在, 1<=pos<=StrLength(S),且0<=len<=StrLength(S)-pos+1,用Sub返回串S的第pos个字符起长度为len的子串。
Index(S,T,pos):串S和T存在,T是非空串,1<=pos<=StrLength(S)。若主串S中存在和串T值相同的子串,则返回它在主串S中的第pos个字符之后第一次出现的位置,否则返回0。
Replace(S,T,V):串S、T和V,T是非空串。用V替换主串S中出现的所有与T相等的不重叠的子串。
StrInsert(S,pos,T):串S和T存在,1<=pos<=StrLength(S)+1。在串S的第pos个字符之前插入串T。
StrDelete(S,pos,len):串S存在,1<=pos<=StrLength(S)-len+1。从串S中删除第pos个字符起长度为len的子串。
endADT
KMP模式匹配算法
代码:
目的:计算出当前要匹配的串T的next数组
void get_next(String T, int *next)
{
int i,j;
i=0;
j=0;
next[1]=0;
while (i<T[0]) //此处的T[0]表示串T的长度
{
if (j==0||T[i]==T[j]) //T[i]表示后缀的单个字符 T[j]表示前缀的单个字符
{
++i;
++j;
next[i]=j;
}
else
j=next[j];//若字符不相同,则 j 回溯
}
}
匹配算法:
int Index_KMP(String S, String T, int pos)
{
int i = pos;//i 用于主串S当前位置下标值,若pos不为1,则从pos位置开始匹配。
int j = 1; //j 用于子串T中当前位置的下标值
int next[255]; //定义一组next数组
get_next(T, next); // 对串T进行分析,得到next数组
while (i <= S[0] && j <= T[0]) //若i小于S的长度且j小于T的长度时,循环继续
{
if (j == 0 || S[i] == T[j]) //两字母相等则继续
{
++i;
++j;
}
else //指针后退重新开始匹配
{
j = next[j];
}
}
if (j > T[0])
return i-T[0];
else
return 0;
}
改进的算法:
由于T串中的第2、3、4、5位置的字符都与首位相同,那么可以用首位next[1]
的值去取代与它相等的字符后续next[j]
的值。
void get_next(String T, int *next)
{
int i,j;
i=0;
j=0;
nextval[1]=0;
while (i<T[0]) //此处的T[0]表示串T的长度
{
if (j==0||T[i]==T[j]) //T[i]表示后缀的单个字符 T[j]表示前缀的单个字符
{
++i;
++j;
if (T[i] != T[j]) //若当前字符与前缀字符不同
nextval[i] = j; //则当前的j为nextval在i的位置值
else
nextval[i] = nextval [j];//若与前缀字符相同,则前缀字符的nextval值赋值给nextval在i位置的值
}
else
j=nextval[j]; //若字符不同 则j值回溯。
}
}