hdu 1711 Number Sequence KMP模板题

题目:Number Sequence

Time Limit: 10000/5000 MS (Java/Others)
Memory Limit: 32768/32768 K (Java/Others)

Problem Description

Given two sequences of numbers : a[1], a[2], …… , a[N], and b[1], b[2], …… , b[M] (1 <= M <= 10000, 1 <= N <= 1000000). Your task is to find a number K which make a[K] = b[1], a[K + 1] = b[2], …… , a[K + M - 1] = b[M]. If there are more than one K exist, output the smallest one.

Input

The first line of input is a number T which indicate the number of cases. Each case contains three lines. The first line is two numbers N and M (1 <= M <= 10000, 1 <= N <= 1000000). The second line contains N integers which indicate a[1], a[2], …… , a[N]. The third line contains M integers which indicate b[1], b[2], …… , b[M]. All integers are in the range of [-1000000, 1000000].

Output

For each test case, you should output one line which only contain K described above. If no such K exists, output -1 instead.

Sample Input
2
13 5
1 2 1 2 3 1 2 3 1 3 2 1 2
1 2 3 1 3
13 5
1 2 1 2 3 1 2 3 1 3 2 1 2
1 2 3 2 1

Sample Output
6
-1

本渣参考一些资料准备讲一下KMP,一般针对字符串。
KMP是一个字符串匹配的算法,假设文本是一个长度为n的字符串T,模板是一个长度为m的字符串P,且m<=n。需要求出模板在文本中的所有匹配点i,既满足T[i]=p[1],………….,T[m-1]=P[m-1] 的非负整数i(注意字符串下标是从0开始)。

最朴素的算法是以此判断每个位置s是不是一个匹配点。检查匹配点需要O(m)时间(每一个字符注意比较),而可能的匹配点有O(n-m)个,所以最坏的情况时间复杂度为O(m(n-1))。
有一个简单的优化: 在检查匹配点的合法性时只要有一个字符不同,立刻停止比较,换下一个匹配点。但最坏的情况仍然需要O(m(n-1))。

这个题是典型的KMP,一般KMP处理的是字符串,但对于数组也是一样的。

先看此题代码:

#include<stdio.h>
#include<string.h>
#include<algorithm>
#include<iostream>
using namespace std;
int s[1000009],p[10009];
int next[10009];
int n,m;
void getnext()
{
    next[0]=-1;
    int k=-1;
    int j=0;
    while(j<m-1)
    {
        if(k==-1||p[j]==p[k])
        {
            j++;
            k++;
            if(p[j]!=p[k])
                next[j]=k;
            else
                next[j]=next[k];
        }
        else
            k=next[k];
    }
}
int kmp()
{
    getnext();
    int i=0;
    int j=0;
    while(i<n&&j<m)
    {
        if(j==-1||s[i]==p[j])
        {
            i++;
            j++;
        }
        else
            j=next[j];
    }
    if(j==m)
        return i-j+1;
    else
        return -1;
}
int main()
{
    int t;
    scanf("%d",&t);
    while(t--)
    {
        scanf("%d%d",&n,&m);
        for(int i=0;i<n;i++)
        scanf("%d",&s[i]);     
        for(int i=0;i<m;i++)
            scanf("%d",&p[i]);
            int ans=kmp();
            printf("%d\n",ans);
    }
}

和朴素算法相比,KMP算法的时间效率就强很多了,它首先用O(m)对模板进行预处理,然后用O(n)时间完成匹配。从渐进意义上说,这样的时间复杂度已经是最好的了(至少需要O(n+m)时间,因为需要检查文本串和模式串的每个字符)。


需要重点注意求next数组的方法

void getnext()
{
    next[0]=-1;
    int k=-1;
    int j=0;
    while(j<m-1)
    {
        if(k==-1||p[j]==p[k])
        {
            j++;
            k++;
            if(p[j]!=p[k])
                next[j]=k;
            else
                next[j]=next[k];
        }
        else
            k=next[k];
    }
}

其实next数组就是它之前的数或数组前缀后缀最大公共元素。
即next[i]是i之前的数或字符串前缀后缀最大公共元素。


了解了next数组的求法后,KMP就非常简单了,就是模板串位置 j 与文本串位置 i 匹配过程中,如果匹配,模板串和文本串都向后移,即i++,j++;如果不匹配,文本串位置不变,模板串位置变为next[j],即j=next[j];

KMP:

int kmp()
{
    getnext();
    int i=0;
    int j=0;
    while(i<n&&j<m)
    {
        if(j==-1||s[i]==p[j])
        {
            i++;
            j++;
        }
        else
            j=next[j];
    }
    if(j==m)
        return i-j+1;
    else
        return -1;
}

这里的代码是对于数组的,对于字符串也是一样的。

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值