KMP算法-实现多重查找

GlorygloryGlory

于 2020-09-13 16:48:49 发布

阅读量1.3k

点赞数

文章标签：算法数据结构

本文链接：https://blog.csdn.net/weixin_44024891/article/details/108564095

版权

这个算法是计算关于字符串匹配问题。
求一个字符串在另一个字符串是否存在，如果存在下标在哪里？

str1 = “abcdefgh”
str2 = “efg”
求str2是否为str1的字串，很显然可以看出下标为4.

这里我推荐大家看下刘毅大佬的文章，写得很详细。
大佬KMP算法详解
 另一位大佬的KMP解析

我相信大家看完之后，就会有所体会、了解。

这块大佬给我们留下一些猜想，就是第一次找到了就不会去寻找了， str1字符串中后面或许还有的呢, 我就做一些弥补吧，也是写这篇文章的原因。

基于大佬给出的思想和代码，其实用心你就会发现很简单的。

str1 = “abcdefghlmngh”
str2 = “gh”
我们可以发现str2在str1中6号下标有一次，在11下标还有一次。

str1 = “abcdefggggglmngg”
str2 = “gg”
在下标为6、7、8、9 和 14存在。

那么这就是我们更新的。

我直接给源码，也就是在主KMP算法中做一些调整就可以。

//优化过后的next 数组求法  
void GetNextval(string p, vector<int>& next)
{
	int p_len = p.size();
	int i = 0;
	int j = -1;
	next[0] = -1;

	while (i < p_len) {
		if (j == -1 || p[i] == p[j]) {
			i++;
			j++;

			if (p[i] != p[j]) {
				next[i] = j;
			}
			else {
				next[i] = next[j];
			}
		}
		else {
			j = next[j];
		}
	}
}

//KMP算法
void KmpSearch(const char* s, const char* p, const vector<int>& next, vector<int>& tmp)
{
	int i = 0;
	int j = 0;
	int sLen = strlen(s);
	int pLen = strlen(p);

	while (i < sLen) {			//如果想要找后续的， 就必须以str1结束为标准
		while (i < sLen && j < pLen)
		{
			//①如果j = -1，或者当前字符匹配成功（即S[i] == P[j]），都令i++，j++      
			if (j == -1 || s[i] == p[j])
			{
				i++;
				j++;
			}
			else
			{
				//②如果j != -1，且当前字符匹配失败（即S[i] != P[j]），则令 i 不变，j = next[j]      
				//next[j]即为j所对应的next值        
				j = next[j];
			}
		}
		if (j == pLen) {				//能够出来代表找到了一次，记录下
			tmp.push_back(i - j);		//存起来
			i = i - j + 1;				//重新设置i的起点， 在找到的下标加+1
			j = 0;						//重新设置j的起点， 设置为0
		}
		else {							//一次都没有找到，证明没有，退出
			break;
		}
	}
}

测试结果:

const char* str1 = “abcdefghlmngh”;
const char* str2 = “gh”;

在这里插入图片描述

const char* str1 = “abcdefggggglmngg”;
const char* str2 = “gg”;

在这里插入图片描述

GlorygloryGlory

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
KMP算法-实现多重查找

这个算法是计算关于字符串匹配问题。求一个字符串在另一个字符串是否存在，如果存在下标在哪里？str1 = “abcdefgh”str2 = “efg”求str2是否为str1的字串，很显然可以看出下标为4.这里我推荐大家看下刘毅大佬的文章，写得很详细。大佬KMP算法详解另一位大佬的KMP解析我相信大家看完之后，就会有所体会、了解。这块大佬给我们留下一些猜想，就是第一次找到了就不会去寻找了， str1字符串中后面或许还有的呢, 我就做一些弥补吧，也是写这篇文章的原因。基于大佬给
复制链接

扫一扫