《算法竞赛进阶指南》0x15字符串

KMP模式匹配

KMP算法,又称模式匹配算法,能够在线性时间内判定字符串A[1~N]是否为字符串B[1~M]的字串,并求字符串A在字符串B中各次出现的位置。

KMP算法分为两步

1.对字符串A进行自我匹配,求出一个数组next,其中next[i]表示“A中以i结尾的非前缀子串“与”A的前缀“能够匹配的最大长度,即
n e x t [ i ] = m a x { j } , 其中 j < i , 并且 A [ i − j + 1 →   i ] = A [ 1 → i ] next[i]=max\{j\},其中j<i,并且A[i-j+1\to~i]=A[1\to i] next[i]=max{j},其中j<i,并且A[ij+1 i]=A[1i]
特别地,不存在这样的j时,令next[i]=0

2.对字符串A和B进行匹配,求出一个数组f,其中f[i]表示”B中以i结尾的子串“与”A的前缀“能够匹配的最大长度,即
f [ i ] = m a x { j } , 其中 j ≤ i , 并且 B [ i − j + 1 →   i ] = A [ 1 → i ] f[i]=max\{j\},其中j\leq i,并且B[i-j+1\to~i]=A[1\to i] f[i]=max{j},其中ji,并且B[ij+1 i]=A[1i]


KMP算法next数组的求法
1.初始化next[1]=j=0,假设next[1~i-1]已求出,下面求解next[i]。
2.不断尝试扩展长度j,如果扩展失败(下一个字符不相等),令j变为next[j],直至j变为0(应从头开始匹配)。
3.如果能够扩展成功,匹配长度j就增加1,next[i]的值就是j。

next[1]=0;
for(int i=2,j=0;i<=n;i++)
{
	while(j>0&&a[i]!=a[j+1])j=next[j];
	if(a[i]==a[j+1])j++;
	next[i]=j;
}

KMP算法f数组的求法

for(int i=1,j=0;i<=m;i++)
{
	while(j>0&&(j==n||b[i]!=a[j+1]))j=next[j];
	if(b[i]==a[j+1])j++;
	f[i]=j;
	//if(f[i]==n),此时就是A在B中的某一次出现	
} 

时间复杂度O(N+M)


例题
acwing141.周期

引理
S[1~i]具有长度为len的循环元的充要条件是len能整除i并且S[len+1~i]=S[1~i-len]。

根据引理,当i-next[i]能够整除i时,S[1~i-next[i]]就是S[1~i]的最小循环元。

#include<iostream>
using namespace std;
#define MAX_N 1000000
int nxt[MAX_N+5];
char s[MAX_N+5];
int main()
{
    int n;
    int t=1;
    while(cin>>n,n)
    {
        scanf("%s",s+1);
        printf("Test case #%d\n",t++);
        for(int i=2,j=0;i<=n;i++)
        {
            while(j>0&&s[i]!=s[j+1])j=nxt[j];
            if(s[i]==s[j+1])j++;
            nxt[i]=j;
        }
        for(int i=1;i<=n;i++)
        {
            if(i%(i-nxt[i])==0&&nxt[i])
            {
                printf("%d %d\n",i,i/(i-nxt[i]));
            }
        }
        cout<<endl;
    }
    return 0;
}

最小表示法

给定一个字符串S[1~n],如果我们不断把它的最后一个字符放到开头,最终会得到n个字符串,称这n个字符串是循环同构的。这些字符串中字典序最小的一个称为字符串S的最小表示法。


最小表示法
1.初始化i=1,j=2。
2.通过直接向后扫描的方法,比较B[i]与B[j]两个循环同构串。
(1)如果扫描了n个字符后仍相等,说明S有更小的循环元,并且该循环元已完成扫描,S[min(i,j)]即为最小表示,算法结束。
(2)如果在i+k和j+k处发现不相等:
若SS[i+k]>SS[j+k],令i=i+k+1,若此时i=j,再令i=i+1。
若SS[i+k]<SS[j+k],令j=j+k+1,若此时i=j,再令j=j+1。
3.若i>n或j>n,则B[min(i,j)]为最小表示;否则重复第2步。


int n=strlen(s+1);
for(int i=1;i<=n;i++)s[n+i]=s[i];
int i=1,j=2,k;
while(i<=n&&j<=n)
{
	for(k=0;k<n&&s[i+k]==s[j+k];k++)
	if(k==n)break;
	if(s[i+k]>s[j+k])
	{
		i=i+k+1;
		if(i==j)i++;
	}
	else{
		j=j+k+1;
		if(i==j)j++;
	}
}
ans=min(i,j)l//B[ans]是最小表示 
  • 15
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值