KMP算法

最新推荐文章于 2022-12-31 17:02:52 发布

AC_Niceuo

最新推荐文章于 2022-12-31 17:02:52 发布

阅读量433

点赞数

分类专栏：山理工OJ学习 SDUT总结数据结构

本文链接：https://blog.csdn.net/fightingeveryday365/article/details/77530762

版权

山理工OJ学习同时被 3 个专栏收录

106 篇文章 14 订阅

订阅专栏

数据结构

19 篇文章 0 订阅

订阅专栏

SDUT总结

7 篇文章 0 订阅

订阅专栏

在百度中，看到了不少关于KMP算法的介绍。

普通的粗暴方式的时间复杂度一度飙到O(NM)，而KMP算法所耗费的时间复杂度降到了O(N+M),这可以说是一个壮举。

而粗暴的处理方式也称为BF算法，这种算法很容易想明白，BF算法的思想就是将目标串S的第一个字符与模式串P的第一个字符进行匹配，若相等，则继续比较S的第二个字符和P的第二个字符；若不相等，则比较S的第二个字符和P的第一个字符，依次比较下去，直到得出最后的匹配结果。

举例说明：

S: ababcababa

P: ababa

　 BF算法匹配的步骤如下

i=0 i=1 i=2 i=3 i=4

第一趟:ababcababa 第二趟:ababcababa 第三趟:ababcababa 第四趟:ababcababa 第五趟:ababcababa

ababa ababa ababa ababa ababa

j=0 j=1 j=2 j=3 j=4(i和j回溯)

i=1 i=2 i=3 i=4 i=3

第六趟:ababcababa 第七趟:ababcababa 第八趟:ababcababa 第九趟:ababcababa 第十趟:ababcababa

ababa ababa ababa ababa ababa

j=0 j=0 j=1 j=2(i和j回溯) j=0

i=4 i=5 i=6 i=7 i=8

第十一趟:ababcababa 第十二趟:ababcababa 第十三趟:ababcababa 第十四趟:ababcababa 第十五趟:ababcababa

ababa ababa ababa ababa ababa

j=0 j=0 j=1 j=2 j=3

i=9

第十六趟:ababcababa

ababa

j=4(匹配成功)

代码实现：

int BFMatch(char *s,char *p)
{
    int i,j;
    i=0;
    while(i<strlen(s))
    {
        j=0;
        while(s[i]==p[j]&&j<strlen(p))
        {
            i++;
            j++;
        }
        if(j==strlen(p))
            return i-strlen(p);
        i=i-j+1;                //指针i回溯
    }
    return -1;    
}

又因为BF算法的时间局限性，三位大咖（***、***、***）又发明了KMP算法。效率极高但不容易理解，现在也是晕晕乎乎不明不白的，先把知识点摆上以后慢慢理解。

KMP算法推荐文章：

http://blog.csdn.net/v_july_v/article/details/7041827# 大神的存在

http://www.matrix67.com/blog/archives/115

http://billhoo.blog.51cto.com/2337751/411486

http://www.cnblogs.com/dolphin0520/archive/2011/08/24/2151846.html

留着以后慢慢理解。

附上一道山东理工ACM中关于KMP的题目 3311——数据结构实验之串三：KMP应用

Problem Description
有n个小朋友，每个小朋友手里有一些糖块，现在这些小朋友排成一排，编号是由1到n。现在给出m个数，能不能唯一的确定一对值l和r(l <= r)，使得这m个数刚好是第l个小朋友到第r个小朋友手里的糖块数？

Input
首先输入一个整数n，代表有n个小朋友。下一行输入n个数，分别代表每个小朋友手里糖的数量。

之后再输入一个整数m，代表下面有m个数。下一行输入这m个数。

Output
 如果能唯一的确定一对l,r的值，那么输出这两个值，否则输出-1

Example Input
5
1 2 3 4 5
3
2 3 4Example Output
2 4
Hint

#include<iostream>
#include<algorithm>
#include<cstring>
using namespace std;
const int maxn=100000000+1000;
int next[maxn];
int a[maxn], b[maxn];
void getnext(int len)///寻找每个位置的最大公共子缀的长度
{
	int i=0,j=-1;
	next[0]=-1;
	while(i<len)
	{
		if(j==-1||b[i]==b[j])
		{
			i++;
			j++;
			next[i]=j;
		}
		else
		{
			j=next[j];
		}
	}
}
int kmp(int lena, int lenb, int p)
{
    getnext(lenb);
    int i=p, j=0;
    while(i<lena&&j<lenb)
    {
        if(j==-1||a[i]==b[j])
        {
            i++;
            j++;
        }
        else
        {
            j=next[j];
        }
    }
    if(j==lenb)
        return i-lenb+1;
    else
        return -1;
}
int main()
{
    ios::sync_with_stdio(false);
    int n, m;
    while(cin>>n)
    {
        for(int i=0;i<n;i++)
            cin>>a[i];
        cin>>m;
        for(int i=0;i<m;i++)
            cin>>b[i];
        int x=kmp(n, m, 0);///需要判断两次，因为题意是是唯一确定的一对l和r；
        if(x!=-1)
        {
            int k=kmp(n, m, x+m-1);
            if(k==-1)
                cout<<x<<" "<<x+m-1<<endl;///输出的是数组下标，并不是数组值
            else
                cout<<"-1"<<endl;
        }
        else
            cout<<"-1"<<endl;
    }
    return 0;
}