【C++算法模板】KMP算法:字符串匹配算法

0)概述

  • 在做模式串与文本串的匹配问题时,匹配失败时,如果每次都只向后递进一位,时间复杂度为 O ( n + m ) O(n+m) O(n+m),很容易被卡成 O ( m × n ) O(m×n) O(m×n) ,所以为了降低字符串匹配算法的时间复杂度,对模式串中的每一位,设置唯一特定变化位置,这个在失配之后的特定变化位置可以帮助我们利用已有的数据不用从头匹配,从而节约时间
  • n e ne ne 数组记录到它为止的模式串前缀的真前缀和真后缀最大相同的位置
  • i = 1 i=1 i=1 i = 2 i=2 i=2 时, n e [ i ] ne[i] ne[i] 的返回值是 1 1 1,即 n e [ 1 ] = n e [ 2 ] = 1 ne[1]=ne[2]=1 ne[1]=ne[2]=1 (当下标从 1 1 1 开始),因为当 n = 1 n=1 n=1 时(只有一个元素,此时无前后缀),当 n = 2 n=2 n=2 时(两个元素,一个是前缀一个是后缀,仍然回溯到第一个位置)

1)求解next数组

// 求next数组的过程[s1与自己匹配,通过前后缀来更新ne数组]
for(int i=2,j=0;i<=len1;i++)
{
    while (j && s1[i]!=s1[j+1])
        j=ne[j]; // 如果不匹配的话,j就一直后退
    if(s1[i]==s1[j+1])
        j++; // 如果当前匹配成功的,j向前递推一位
    ne[i]=j; // 记录并且更新当前j的长度
}
  • 当看不懂或者忘了的时候建议自己调试模拟跟踪一遍

  • 因为 n e ne ne 数组是全局初始化, w h i l e ( ) while() while() 语句中的 j j j 保证了 n e [ 1 ] = n e [ 2 ] ne[1]=ne[2] ne[1]=ne[2]

  • 注意next数组的值是根据模式串的前缀和后缀的最大相同位置来的,所以匹配自己。

2)求解匹配位置的核心函数

// 求匹配的过程[i遍历文本串]
for(int i=1,j=0;i<=len2;i++ )
{
    // 如果不匹配的话,j回退
    while(j && s2[i]!=s1[j+1])
        j=ne[j];
    // 如果相等的话,j向前递推一位
    if(s2[i]==s1[j+1])
        j++;
    // 刚好长度相等的话说明匹配上了,把下标打印出来
    if(j==len1)
    {
        // 文本串的位置减去长度即为下标,加1得到位置
        printf("%d ",i-len1+1);
        // 模板串在模式串中出现的位置可能是重叠的
        // 需要让j回退到一定位置,再让i加1继续进行比较
        // 回退到ne[j]可以保证j最大,即已经成功匹配的部分最长
        j=ne[j];
    }
}
  • 核心实现和求解 n e x t next next 数组的函数差不多,主要是是模式串和文本串之间的匹配,当 j = = l e n 1 j==len1 j==len1 的时候说明大小相等即匹配上了,这个时候把相应的下标位置输出出来,同时 j j j 还是要回溯,因为怕遇到位置重叠的情况。

3)完整代码

题目链接:P3375 【模板】KMP - 洛谷

#include<bits/stdc++.h>
using namespace std;
const int N=10;
int len1,len2; // n是模板串长度,m是文本串
int ne[N]; // next[i] 就是使子串 s2[0···i] 有最长相等前后缀的前缀的最后一位的下标
char s1[N],s2[N]; // s1[]存储模式串,s2[]存储文本串
// 计算p[]在s[]中出现的位置
// ne代表next数组,因为next在C++中是关键字
int main()
{
	cin>>s1+1>>s2+1; // 先输入模式串,再输入文本串[从下标1开始]
	len1=strlen(s1+1);
	len2=strlen(s2+1);
	cout<<len1<<' '<<len2<<endl;
	// 求next数组的过程[s1与自己匹配,通过前后缀来更新ne数组]
	for(int i=2,j=0;i<=len1;i++)
	{
		while (j && s1[i]!=s1[j+1])
			j=ne[j]; // 如果不匹配的话,j就一直后退
		if(s1[i]==s1[j+1])
			j++; // 如果当前匹配成功的,j向前递推一位
		ne[i]=j; // 记录并且更新当前j的长度
	}
	// 求匹配的过程[i遍历文本串]
	for(int i=1,j=0;i<=len2;i++ )
	{
		// 如果不匹配的话,j回退
		while(j && s2[i]!=s1[j+1])
			j=ne[j];
		// 如果相等的话,j向前递推一位
		if(s2[i]==s1[j+1])
			j++;
		// 刚好长度相等的话说明匹配上了,把下标打印出来
		if(j==len1)
		{
			// 文本串的位置减去长度即为下标
			printf("%d ",i-len1);
			// 模板串在模式串中出现的位置可能是重叠的
			// 需要让j回退到一定位置,再让i加1继续进行比较
			// 回退到ne[j]可以保证 j 最大,即已经成功匹配的部分最长
			j=ne[j];
		}
	}
	// 还需要把next数组输出出来
	for(auto num:ne) 
		cout<<num<<' ';
	cout<<endl;
	return 0;
}
  • 30
    点赞
  • 24
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值