POJ3415 Common Substrings【后缀数组(长度不小于 k 的公共子串的个数)】

题目描述:

RT,给定两个字符串 A 和 B,求长度不小于 k 的公共子串的个数(可以相同)。
样例 :
A=“xx”,B=“xx”,k=1,长度不小于 k 的公共子串的个数是 5。

题目分析:

基本思路是计算 A 的所有后缀和 B 的所有后缀之间的最长公共前缀的长度,把最长公共前缀长度不小于 k 的部分全部加起来。先将两个字符串连起来,中间用一个没有出现过的字符隔开。按 height 值分组后,接下来的工作便是快速的统计每组中后缀之间的最长公共前缀之和。扫描一遍,每遇到一个 B 的后缀就统计与前面的 A 的后缀能产生多少个长度不小于 k 的公共子串,这里 A 的后缀需要用一个单调的栈来高效的维护。然后对 A 也这样做一次。

具体实现时存一个 ret 表示一个栈中A的 h*个数 之和,每次用 h [ i ] h[i] h[i]去更新栈中的h,注意插入A时要保证它的h为极大值,因为此时A的贡献是还没有确定的,需要后面的一个后缀来确定。

Code:

#include<cstdio>
#include<cstring>
#include<algorithm>
#define maxn 200005
using namespace std;
int b[maxn],ary[4][maxn],h[maxn];
int *sa=ary[0],*rk=ary[1],*nsa=ary[2],*nrk=ary[3];
void build_sa(int n,int m,int *a){
	memset(b,0,(m+1)<<2),a[n+1]=rk[n+1]=0;
	for(int i=1;i<=n;i++) b[a[i]]++;
	for(int i=1;i<=m;i++) b[i]+=b[i-1];
	for(int i=1;i<=n;i++) sa[b[a[i]]--]=i;
	for(int i=1;i<=n;i++) rk[sa[i]]=rk[sa[i-1]]+(a[sa[i-1]]!=a[sa[i]]);
	for(int k=1;rk[sa[n]]<n;k<<=1){
		for(int i=1;i<=n;i++) b[rk[sa[i]]]=i;
		for(int i=n;i>=1;i--) if(sa[i]>k) nsa[b[rk[sa[i]-k]]--]=sa[i]-k;
		for(int i=n-k+1;i<=n;i++) nsa[b[rk[i]]--]=i;
		for(int i=1;i<=n;i++) nrk[nsa[i]]=nrk[nsa[i-1]]+(rk[nsa[i-1]]!=rk[nsa[i]]||rk[nsa[i-1]+k]!=rk[nsa[i]+k]);
		swap(sa,nsa),swap(rk,nrk);	
	}
	for(int i=1,k=0,j;i<=n;h[rk[i]]=k,i++)
		for(k&&(k--),j=sa[rk[i]-1];a[i+k]==a[j+k];k++);
}
int n,m,k,a[maxn],top;
char s0[maxn],s1[maxn];
long long ans,ret;
struct node{int x,s;}S[maxn];
void solve(bool t){
	for(int i=1;i<=n+m+1;i++)
		if(h[i]<k) (sa[i]<=n)==t?(S[top=1]=(node){maxn,1},ret=maxn-k+1):(ret=top=0);
		else{
			int s=0;
			for(;top>=1&&S[top].x>=h[i];top--) ret-=1ll*(S[top].x-k+1)*S[top].s,s+=S[top].s;
			if(s) ret+=1ll*(h[i]-k+1)*s,S[++top]=(node){h[i],s};
			if((sa[i]<=n)==t) ret+=maxn-k+1,S[++top]=(node){maxn,1};
			else ans+=ret;
		}
}
int main()
{
	while(scanf("%d",&k),k){
		scanf("%s%s",s0+1,s1+1);
		n=strlen(s0+1),m=strlen(s1+1),a[n+1]=1;
		for(int i=1;i<=n;i++) a[i]=s0[i];
		for(int i=1;i<=m;i++) a[n+1+i]=s1[i];
		build_sa(n+m+1,255,a);
		ans=0,solve(0),solve(1);
		printf("%lld\n",ans);
	}
}

Upd:也可以单调栈求出每个 h [ i ] ( ≥ k ) h[i](\ge k) h[i](k)作为最小值的区间,然后用 i i i左边A的个数乘上 i i i右边B的个数,加上 i i i左边B的个数乘上 i i i右边A的个数。

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值