如何判断一个子串在母串中第一次出现的位置,如果要统计其出现的位置和出现的次数?
kmp算法最重要的就是,一旦发现了母串s和子串s的不匹配,不是将子串s向后移动一位,而是根据前面匹配信息向后移动多位,而这个多位获得就是根据next数组,next数组的求解方式如下:
next数组是根据字符串前缀和后缀的匹配程度来确定的。
①寻找前缀后缀最长公共元素长度
举个例子,如果给定的模式串为“abab”,那么它的各个子串的前缀后缀的公共元素的最大长度如下表格所示:
比如对于字符串aba来说,它有长度为1的相同前缀后缀a;而对于字符串abab来说,它有长度为2的相同前缀后缀ab(相同前缀后缀的长度为k + 1,k + 1 = 2)。
②求next数组
将第①步骤中求得的数组整体右移一位,然后第一个元素赋为-1即可(注意:字符串下标需要从0开始),如下表格所示:
当模式串中的某个字符跟文本串中的某个字符匹配失配时,模式串下一步应该跳到哪个位置。
next数组的求解:
vector<int> getnext(string str)
{
int len = str.size();
vector<int> next(len,0);
next[0] = -1;//next数组初值为-1
int k = -1, j = 0;//k表示应该跳转的位置
while (j<len - 1)
{
if (k == -1 || str[j] == str[k])//str[j]后缀 str[k]前缀
{
j++;
k++;
next[j] = k;
}
else
{
k = next[k];
}
}
return next;
}
整体的KMP算法求解:
int KMP(string haystack, string needle) {
if (needle.empty())
return 0;
int i = 0;//源串
int j = 0;//子串
int len1 = haystack.size();
int len2 = needle.size();
vector<int> next;
next = getnext(needle);
while (i<len1 && j<len2)
{
if (j == -1 || haystack[i] == needle[j])
{
i++;
j++;
}
else
{
j = next[j];//获取下一次匹配的位置
}
}
if (j == len2)
return i - j;
return -1;
}
leetcode:28. 实现 strStr()