1、串
(1)串的补充
C语言中常见串运算
调用标准库函数 #include<string.h>
串比较,strcmp(char s1,char s2)
串复制,strcpy(char to,char from)
串连接,strcat(char to,char from)
求串长,strlen(char s)
(2)串的模式匹配算法
1、BF算法
将主串的第pos个字符和模式的第一个字符比较,
若相等,继续逐个比较后续字符;
若不等,从主串的下一字符起,重新与模式的第一个字符比较。
直到主串的一个连续子串字符序列与模式相等 。返回值为S中与T匹配的子序列第一个字符的序号,即匹配成功。
否则,匹配失败,返回值 0。
2、KMP匹配算法。
void get_next(char* T, int *next)
{//next数组求法。 当前位置不匹配时,需要返回并重新比对的位置。
int i= 1;//i为当前需要赋值的next数组位置
next[1] = 0; int j = 0; // 初始化,第一个为0,j为当前需要返回的位置
while( i<T[0]){//T[0]为数组长度。
if(j==0 || T[i] == T[j]){//当需要重新匹配,或者当前能匹配上时。
++i; ++j; //下一个位置就能配配上的j+1个
next[i] = j;
}
else//匹配不上了,j就成了当前需要返回的位置
j = next[j];
}
}
int Index_KMP (SString S,SString T, int pos)
{ //实际上原理和next相同。
int i= pos,j =1;//i指向主串位置,j指向模式位置
while (i<S[0] && j<T[0]) {
if (j==0 || S[i]==T[j]) { //比对成功继续比对
i++;j++; }
else
j=next[j]; /*比对不成功,i不变,j后退*/
}
if (j>T[0]) return i-T[0]; /*匹配成功,返回匹配成功的起始位置*/
else return 0; /*返回不匹配标志*/
}
3、next数组的改进
next[j] = k,而pj=pk,则 主串中si和pj不等时,不需再和pk进行比较,而直接和pnext[k]进行比较。这种算法比上种更好,更快。
nextval数组求法。
void get_nextval(SString T, int &nextval[])
{
i= 1; nextval[1] = 0; j = 0;
while( i<T[0]){
if(j==0 || T[i] == T[j]){
++i; ++j;
if(T[i] != T[j]) nextval[i] = j;
else nextval[i] = nextval[j];
}
else j = nextval[j];
}
}