1.串数据存储
使用string字符串进行数据存储,串头不需要计数字符总数,也就是不需要将所有字符后退一位。
2.匹配方式
设现字符S1=“s1,s2,s3....sn”为主串,S2="s1,s2,s3....sm"为匹配串,将S2串成为模式串,再S1中寻找完全等于S2的子串。NEXT数组存储
S2每一个元素失配时,可以可以让S1从字符串首回溯的个数。(默认各位理解next数组含义)
void getnext(string s,int next[]) {
int len = s.size(); //len计算s的最大长度
if (len >= 1)
next[0] = 1; //预先S2第一个元素的回溯个数为1,因为显而易见的自己和自己匹配时,不可能从第一个开始
if (len >= 2)
next[1] = 1;//设置第二个元素回溯个数为1,因为不论S[2]是否等于S[1],作为一个开始匹配的字符回溯个数只能为1
int i = 1, j = 1;//初始化index,i为主串当前匹配字符,j为模式串当前字符。 i初始化1是由于从第二个字符开始匹配,
//而模式串当前字符串为j-1,j=1是因为所以next值均大于等于1。假设next[0]=0,j=0,而当串不匹配时j只能回溯为next[j]
//的值,那么匹配串将卡死再 j(1)=next[j(1)],因此做出如下优。
while (i < len) {
if (s[i] == s[j - 1]) {//字符串匹配时,同时向后移动一个,并且设置next值
i++;
j++;
next[i] = j;//简化写next[++i] = ++j;为了易度分开来写
}
else if (j == 1) {//回溯推出点,当j==1时,说明当前字符无法匹配任何一个字符,设置为1,主串指向下一个
i++;
next[i] = 1;
}
else j = next[j];//向前回溯,寻找当前值可能相同的回溯点
}
}
int KMP(string s1, string s2, int next[]) {
int i = 0, j = 0;//s1,s2从首位开始匹配
while (i < s1.size() && j < s2.size()) {//如果s1匹配完,或者s2匹配完成,退出while
if (s1[i] == s2[j]) {//如果相等,同时向后
i++;
j++;
}
else if (j == 0) {//当回溯到第一个都无法相等时,主串向后,j不动,因为已经再第一个了
i++;
}
else {
j = next[j] - 1;//得到的可以回溯的值比index多了1,即可以回溯5个,再数组中为s2[4];
}
}
if (j == s2.size())//如果退出while时j指向最后一个(因为最后一个相等时,还执行了一次j++操作,所以比index大一),说明匹配成功了
return i ;//返回匹配成功时主串最后一个字符位置
else return 0;
}
PS:菜鸟的KMP学习日记 BY 2020.11.25
BY:Aaa2同学