关闭

KMP算法 2203 亲和串

82人阅读 评论(0) 收藏 举报
分类:

kmp算法

背景:已知字符串a和字符串b,求字符串b在字符串a中首次出现的位置

kmp算法的核心精髓在于求next数组

next数组含义:next[i] 以 i 结尾(不包括 i)的字符串中前缀和后缀最长相等的长度

比如:s = aabcdaabcd

前缀:a、aa、aab、aabc、aabcd ....... aabcdaabc 都是 s 的前缀

后缀:d、cd、bcd、abcd、aabcd ....... aabcdaabc 都是 s 的后缀

next 数组中 next[0] = -1 这个是一定的,可以看做是规定吧

s的next 数组为

i           0  1  2  3  4  5  6  7  8  9

s          a  a  b  c  d  a  a  b  c  d  

next    -1  0  1  0  0  0  1  2  3  4

就比如说 next[8] 的求法:

以8结尾的字符串为 aabcdaab,我们一眼就可以看出前缀和后缀的最长相等长度为3,即aab和aab,如何让计算机自己求呢?

求next[8]的时候,next[0]~next[7]都是已知的,那么我们可以利用next[7]的结果

以7结尾的字符串为aabcdaa,next[7]=2,那么求next[8]时可以直接判断s[7]是否等于s[next[2]]就好了,如果相等,那么next[8]=next[7]+1,如果不相等,那么就要在判断s[7]是否等于s[next[2]],继续下去,直到相等或者到next[0]=-1了,就跳出循环。

这个表达的也许不是很清楚,光看也不可能看懂,也许还是会有一些不动,一边动手,一边摸索明白可以更好地理解。总之一定要记得next数组的含义

求得了next数组,接下来就是要匹配了

比如 a = aabcdaabcd  i=0,指向a字符串

        b = cdaa              j=0,指向b字符串

先是一位一位的判断是否相等,如果相等那么i++、j++

                                                         不相等那么j = next[j],继续判断,为什么可以这样呢,因为在第 j 位失配(没有匹配),那说明字符串b从0~j-1和字符串a从i-j~i-1相等,而next[j]=k表示字符串b中0~k-1 和 j-k~j-1 是相等的,那么字符串a从i-j~i-1和0~k-1是相等的,即只要比较a[i]==b[next[j]]是否为true就好

KMP算法的思路就是这样了


思路明白了,多写几道题吧,边写边熟悉,直到自己会了

hdu 2203一道挺水的题,适合学会了KMP算法来写,基本上就是套模板了

亲和串


Problem Description
人随着岁数的增长是越大越聪明还是越大越笨,这是一个值得全世界科学家思考的问题,同样的问题Eddy也一直在思考,因为他在很小的时候就知道亲和串如何判断了,但是发现,现在长大了却不知道怎么去判断亲和串了,于是他只好又再一次来请教聪明且乐于助人的你来解决这个问题。
亲和串的定义是这样的:给定两个字符串s1和s2,如果能通过s1循环移位,使s2包含在s1中,那么我们就说s2 是s1的亲和串。
 

Input
本题有多组测试数据,每组数据的第一行包含输入字符串s1,第二行包含输入字符串s2,s1与s2的长度均小于100000。
 

Output
如果s2是s1的亲和串,则输出"yes",反之,输出"no"。每组测试的输出占一行。
 

Sample Input
AABCD CDAA ASD ASDF
 

Sample Output
yes no
 
题目为中文,看一眼就明白题目的意思,思路就是把s1+=s1,然后用kmp算法的模板就ok了

<span style="font-size:18px;">#include<iostream>
#include<cstdio>
#include<cmath>
#include<cstring>
#include<algorithm>
#define LL long long
using namespace std;
const int maxn = 100000+5;
int Next[maxn];
void getNext(string s)
{
    Next[0]=-1;
    Next[1]=0;
    int ls=s.size();
    for(int i=2;i<ls;i++){
        if(s[i-1]==s[Next[i-1]]) Next[i]=Next[i-1]+1;
        else{
            int t=Next[i-1];
            while(s[t]!=s[i-1]){
                t=Next[t];
                if(t==-1) break;
            }
            Next[i]=t+1;
        }
    }
}
int kmp(string s1,string s2)
{
    int ls1=s1.size();
    int ls2=s2.size();
    int i=0,j=0;
    while(i<ls1 && j<ls2){
        if(s1[i]==s2[j]) i++,j++;
        else{
            //j=Next[j];
            while(s1[i]!=s2[j]){
                j=Next[j];
                if(j==-1){
                    i++;
                    j++;
                    break;
                }
            }
        }
        if(j==ls2) return i-ls2;
    }
    return -1;
}
int main()
{
    string s1,s2;
    int ans;
    while(cin>>s1>>s2){
        getNext(s2);
        //for(int i=0;i<s2.size();i++) cout<<Next[i]<<' ';cout<<endl;
        s1+=s1;
        ans=kmp(s1,s2);
        //cout<<"ans="<<ans<<endl;
        if(ans==-1) cout<<"no"<<endl;
        else cout<<"yes"<<endl;
    }
    return 0;
}
</span>


0
0

查看评论
* 以上用户言论只代表其个人观点,不代表CSDN网站的观点或立场
    个人资料
    • 访问:484次
    • 积分:80
    • 等级:
    • 排名:千里之外
    • 原创:8篇
    • 转载:0篇
    • 译文:0篇
    • 评论:0条
    文章分类
    文章存档