acm专题学习之字符串(一)kmp算法+kmp的next理解+CodeForces - 126B

kmp的next:

1 next数组含义:除去第i个数,在一个字符串里面从第一个到第(i-1)字符串的前缀与后缀最长重复的个数。

2 理解一下代码过程:(abacbaba为例)

”“,i==1,前面没有字符,没有前后缀,next为0

“a”,i==2,只有一个字母,没有前后缀,next为0(第1个数)

“ab”,i==3,前缀为“a”,后缀为“b”,前后缀相同长度为0,next为0(第2个数)

“aba”,i==4,前缀为“a”,后缀为“ba”,前后缀相同为1,next为1(第3个数和第1个数一样)

“abac”,i==5,前缀后缀没有相同,next为0(第4个数)

“abacb”,i==6,前缀后缀没有相同,next为0(第5个数)

“abacba”,i==7,前后缀相同为“a”,next为1(第6个数和第1个数一样)

“abacbab”,i==8,前后缀相同为“ab”,next为2(第7个数和第2个数一样)

“abacbaba”,i==9,前后缀相同为“aba”,next为3(第8个数和第3个数一样)

会发现遍历的数和上一次next值指的前缀位置数的关系,如果两个位置的数相同,就说明前缀和遍历到字符的后缀相同的数加一;如果不相同,回溯到该点和前缀相同的地方。

3 代码:

int get_next(char s[],int nexth[])
{
    //next初始化都为0
    int i=1;
    nexth[0]=-1;//第0位没有字符
    int j=-1;
    while(i<s[0])//s[0]表示字符串的长度
    {
        if(j==-1||s[i]==s[j])
        {
            i++;
            j++;
            nexth[i]=j;
        }
        else
        j=nexth[j];//回溯
    }
    return 0;
}

CodeForces - 126B :

题意:给出一个字符串,找出一个子串既是它的前缀,也是它的后缀,还是一个非后缀也非前缀的子串。

代码:

#include <algorithm>
#include <iostream>
#include <string>
#include <vector>
#include <stack>
#include <cstdlib>
#include <map>
#include <queue>
#include <cstdio>
#include <cstring>
#include <cmath>
#include <vector>
using namespace std;
const int maxn=1e6+5;
char s[maxn];
int len;
int nxt[maxn];
int h[maxn];
int get_next()
{
    memset(nxt,0,sizeof(nxt));
    int i=0;
    nxt[0]=-1;
    int j=-1;
    while(i<len)
    {
        if(j==-1||s[i]==s[j])
        {
            i++;
            j++;
            nxt[i]=j;
        }
        else
            j=nxt[j];//回溯
    }
    return 0;
}
int main()
{
    while(~scanf("%s",s))
    {
        len=strlen(s);
        get_next();
        memset(h,0,sizeof(h));
        for(int i=1; i<len; i++)//不包括len
        {
            h[nxt[i]]=1;//记录可以回溯到的点
        }
        int x=nxt[len];//不包含该位置对应的字符,所以不是len-1
        while(!h[x]&&x)//循环到可以回溯,或者x==0且都还是不可回溯
        {
            x=nxt[x];
        }
        if(!x)
        {
            printf("Just a legend\n");
        }
        else
        {
            for(int i=0; i<x; i++)
            {
                printf("%c",s[i]);
            }
            printf("\n");
        }
    }
    return 0;
}

kmp单模式串匹配:

讲讲暴力:暴力匹配其实就是,模式串和主串匹配的时候,每次不匹配就回溯到模式串的第一个字母处。

kmp:建立在模式串计算出的next值上,每次不匹配的时候,回溯到模式串上一个匹配上的字符结构重新对齐(也就是除去不匹配这个点,前面匹配的上一个相同字符结构处),该点对应的next值处。

代码:

int get_next(char s[],int nexth[])
{
    //next初始化都为0
    int i=1;
    nexth[0]=-1;//第0位没有字符
    int j=-1;
    while(i<s[0])//s[0]表示字符串的长度
    {
        if(j==-1||s[i]==s[j])
        {
            i++;
            j++;
            nexth[i]=j;
        }
        else
        j=nexth[j];//回溯
    }
    return 0;
}
int get_pos(char s[],char s1[],int nexth[])
{
    int i=1;
    int j=1;
    while(i<=s[0]&&j<=s1[0])
    {
        if(j==-1||s[i]==s1[j])
        {
            i++;
            j++;
        }
        else
        j=nexth[j];
    }
    if(j>s1[0]) return i-s1[0];//返回匹配的第一个字母的位置
    else return 0;
}

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值