kmp

如何判断一个子串在母串中第一次出现的位置,如果要统计其出现的位置和出现的次数?

转载:腾讯研发类笔试面试试题(C++方向)

kmp算法最重要的就是,一旦发现了母串s和子串s的不匹配,不是将子串s向后移动一位,而是根据前面匹配信息向后移动多位,而这个多位获得就是根据next数组,next数组的求解方式如下:

next数组是根据字符串前缀和后缀的匹配程度来确定的。

①寻找前缀后缀最长公共元素长度

举个例子,如果给定的模式串为“abab”,那么它的各个子串的前缀后缀的公共元素的最大长度如下表格所示:

比如对于字符串aba来说,它有长度为1的相同前缀后缀a;而对于字符串abab来说,它有长度为2的相同前缀后缀ab(相同前缀后缀的长度为k + 1,k + 1 = 2)。

②求next数组
将第①步骤中求得的数组整体右移一位,然后第一个元素赋为-1即可(注意:字符串下标需要从0开始),如下表格所示:

当模式串中的某个字符跟文本串中的某个字符匹配失配时,模式串下一步应该跳到哪个位置。

next数组的求解:

vector<int> getnext(string str)
{
	int len = str.size();
	vector<int> next(len,0);
	next[0] = -1;//next数组初值为-1
	int  k = -1, j = 0;//k表示应该跳转的位置 
	while (j<len - 1)
	{
		if (k == -1 || str[j] == str[k])//str[j]后缀 str[k]前缀
		{
			j++;
			k++;
			next[j] = k;
		}
		else
		{
			k = next[k];
		}
	}
	return next;
}

整体的KMP算法求解: 

int KMP(string haystack, string needle) {
		if (needle.empty())
			return 0;
		int i = 0;//源串
		int j = 0;//子串
		int len1 = haystack.size();
		int len2 = needle.size();
		vector<int> next;
		next = getnext(needle);
		while (i<len1 && j<len2)
		{
			if (j == -1 || haystack[i] == needle[j])
			{
				i++;
				j++;
			}
			else
			{
				j = next[j];//获取下一次匹配的位置
			}
		}
		if (j == len2)
			return i - j;
		return -1;
	}

leetcode:28. 实现 strStr()

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值