BZOJ4566[HAOI2016]找相同字符 && POJ - 3415 Common Substrings【后缀数组】

BZOJ4566[HAOI2016]找相同字符

Time Limit: 20 Sec
Memory Limit: 256 MB

Description

给定两个字符串,求出在两个字符串中各取出一个子串使得这两个子串相同的方案数。两个方案不同当且仅当这两个子串中有一个位置不同。

Input

两行,两个字符串s1,s2,长度分别为n1,n2。1 <=n1, n2<= 200000,字符串中只有小写字母

Output

输出一个整数表示答案


题目分析

首先容易想到最直观的思路
枚举s1和s2的所有后缀,两两求lcp长度,所有lcp的和就是答案
利用height数组直接枚举复杂度是 O ( n 2 ) O(n^2) O(n2)

显然直接枚举一定T爆,我们尝试在上述思路上优化
首先想想枚举的过程是什么,即在height数组上求
每个属于s1的后缀,它与前面属于s2的后缀的lcp长度和
AND 每个属于s2的后缀,它与前面属于s1的后缀的lcp长度和

我们以前者为例讲解 (即设当前枚举位置为height[i],且sa[i]属于s1)
"每个属于s1的后缀,它与前面属于s2的后缀的lcp长度和"可以转化为两部分
1. i i i前面第一个 h e i g h t height height值小于 h e i g h t [ i ] height[i] height[i]的位置 j j j i i i区间内属于s2的后缀数量 乘 height[i]

因为除去 h e i g h t [ j ] height[j] height[j]这个值后这段区间内最小的 h e i g h t height height就是 h e i g h t [ i ] height[i] height[i]
所以区间内所有属于s2的后缀与 s a [ i ] sa[i] sa[i]这个后缀lcp长度都是 h e i g h t [ i ] height[i] height[i]

2. j j j位置的答案总和
即求出 s a [ i ] sa[i] sa[i]这个后缀与 j j j位置前所有属于s2的后缀的lcp总和

到这里用单调栈维护已经很明显了
对s1的后缀和s2的后缀分别扫一次即可

#include<iostream>
#include<cmath>
#include<algorithm>
#include<map>
#include<cstring>
#include<cstdio>
using namespace std;
typedef long long lt;
#define pir pair<int,lt>
#define mkp(x,y) make_pair(x,y)
 
int read()
{
    int f=1,x=0;
    char ss=getchar();
    while(ss<'0'||ss>'9'){if(ss=='-')f=-1;ss=getchar();}
    while(ss>='0'&&ss<='9'){x=x*10+ss-'0';ss=getchar();}
    return f*x;
}

const int maxn=500010;
char s1[maxn],s2[maxn];
int n,m,len1,len2;
int a[maxn];
int rak[maxn],sa[maxn],tp[maxn],tax[maxn];
int height[maxn];
pir st[maxn];
lt top,sum[maxn];

void rsort()
{
	for(int i=0;i<=m;++i) tax[i]=0;
	for(int i=1;i<=n;++i) tax[rak[i]]++;
	for(int i=1;i<=m;++i) tax[i]+=tax[i-1];
	for(int i=n;i>=1;--i) sa[tax[rak[tp[i]]]--]=tp[i];
}

void SA()
{
	m=256;
	for(int i=1;i<=n;++i)
	rak[i]=a[i],tp[i]=i;
	
	rsort();
	for(int k=1;k<=n;k<<=1)
	{
		int p=0;
		for(int i=n-k+1;i<=n;++i) tp[++p]=i;
		for(int i=1;i<=n;++i) if(sa[i]>k) tp[++p]=sa[i]-k;
		
		rsort();
		swap(rak,tp);
		rak[sa[1]]=p=1;
		for(int i=2;i<=n;++i)
		rak[sa[i]]=(tp[sa[i]]==tp[sa[i-1]]&&tp[sa[i]+k]==tp[sa[i-1]+k])?p:++p;
		if(p>=n) break;
		m=p; 
	}
}

void getH()
{
	int k=0;
	for(int i=1;i<=n;++i)
	{
		if(k) --k;
		int j=sa[rak[i]-1];
		while(a[i+k]==a[j+k]) k++;
		height[rak[i]]=k;
	}
}

lt solve()
{
	lt ans=0;
	for(int i=1;i<=n;++i)
	sum[i]=sum[i-1]+(sa[i]<=len1);
	
	for(int i=1;i<=n;++i)
	{
		while(top&&height[i]<height[st[top].first]) top--;
		top++;
		if(i==1) st[top]=mkp(i,0);
		else st[top]=mkp(i,(sum[i-1]-sum[st[top-1].first-1])*height[i]+st[top-1].second);
		if(sa[i]>len1+1) ans+=st[top].second;
	}
	
	top=0;
	for(int i=1;i<=n;++i)
	sum[i]=sum[i-1]+(sa[i]>len1+1);
	
	for(int i=1;i<=n;++i)
	{
		while(top&&height[i]<height[st[top].first]) top--;
		top++;
		if(i==1) st[top]=mkp(i,0);
		else st[top]=mkp(i,(sum[i-1]-sum[st[top-1].first-1])*height[i]+st[top-1].second);
		if(sa[i]<=len1) ans+=st[top].second;
	}
	return ans;
}

int main()
{
    scanf("%s%s",&s1,&s2); 
	len1=strlen(s1); len2=strlen(s2);
    
	for(int i=0;i<len1;++i) a[i+1]=s1[i];
    a[len1+1]='#';
    for(int i=0;i<len2;++i) a[i+len1+2]=s2[i];
    
    n=len1+len2+1;
    SA(); getH();
    
    printf("%lld",solve());
    return 0;
}

POJ - 3415 Common Substrings

Time limit 5000 ms
Memory limit 65536 kB

A substring of a string T is defined as:

T( i, k)= TiTi +1… Ti+k -1, 1≤ i≤ i+k-1≤| T|.
Given two strings A, B and one integer K, we define S, a set of triples (i, j, k):

S = {( i, j, k) | k≥ K, A( i, k)= B( j, k)}.
You are to give the value of |S| for specific A, B and K.

Input

The input file contains several blocks of data. For each block, the first line contains one integer K, followed by two lines containing strings A and B, respectively. The input file is ended by K=0.

1 ≤ |A|, |B| ≤ 105
1 ≤ K ≤ min{|A|, |B|}
Characters of A and B are all Latin letters.

Output

For each case, output an integer |S|.


题目分析

题意和上题基本一致,但要求子串长度大于等于k
只要在height上按k值分组,对每组按上一题的方法求答案最后累加即可

注意这里若lcp长度为 h e i g h t [ i ] height[i] height[i]
每一对贡献的数量应该是 h e i g h t [ i ] − k + 1 height[i]-k+1 height[i]k+1

#include<iostream>
#include<cmath>
#include<algorithm>
#include<map>
#include<cstring>
#include<cstdio>
using namespace std;
typedef long long lt;
#define pir pair<int,lt>
#define mkp(x,y) make_pair(x,y)
 
int read()
{
    int f=1,x=0;
    char ss=getchar();
    while(ss<'0'||ss>'9'){if(ss=='-')f=-1;ss=getchar();}
    while(ss>='0'&&ss<='9'){x=x*10+ss-'0';ss=getchar();}
    return f*x;
}

const int maxn=500010;
char s1[maxn],s2[maxn];
int n,m,len1,len2,k;
int a[maxn];
int rak[maxn],sa[maxn],tp[maxn],tax[maxn];
int height[maxn];
pir st[maxn];
lt top,sum[maxn];

void rsort()
{
	for(int i=0;i<=m;++i) tax[i]=0;
	for(int i=1;i<=n;++i) tax[rak[i]]++;
	for(int i=1;i<=m;++i) tax[i]+=tax[i-1];
	for(int i=n;i>=1;--i) sa[tax[rak[tp[i]]]--]=tp[i];
}

void SA()
{
	m=256;
	for(int i=1;i<=n;++i)
	rak[i]=a[i],tp[i]=i;
	
	rsort();
	for(int k=1;k<=n;k<<=1)
	{
		int p=0;
		for(int i=n-k+1;i<=n;++i) tp[++p]=i;
		for(int i=1;i<=n;++i) if(sa[i]>k) tp[++p]=sa[i]-k;
		
		rsort();
		swap(rak,tp);
		rak[sa[1]]=p=1;
		for(int i=2;i<=n;++i)
		rak[sa[i]]=(tp[sa[i]]==tp[sa[i-1]]&&tp[sa[i]+k]==tp[sa[i-1]+k])?p:++p;
		if(p>=n) break;
		m=p; 
	}
}

void getH()
{
	int k=0;
	for(int i=1;i<=n;++i)
	{
		if(k) --k;
		int j=sa[rak[i]-1];
		while(a[i+k]==a[j+k]) k++;
		height[rak[i]]=k;
	}
}

lt query(int ll,int rr)
{
	if(ll==rr) return 0;
	lt ans=0;
	top=sum[ll-1]=0;
	for(int i=ll;i<=rr;++i)
	sum[i]=sum[i-1]+(sa[i]<=len1);
	
	for(int i=ll;i<=rr;++i)
	{
		while(top&&height[i]<height[st[top].first]) top--;
		top++;
		if(i==ll) st[top]=mkp(i,0);
		else st[top]=mkp(i,(sum[i-1]-sum[st[top-1].first-1])*(height[i]-k+1)+st[top-1].second);
		if(sa[i]>len1+1) ans+=st[top].second;
	}
	
	top=0;
	for(int i=ll;i<=rr;++i)
	sum[i]=sum[i-1]+(sa[i]>len1+1);
	
	for(int i=ll;i<=rr;++i)
	{
		while(top&&height[i]<height[st[top].first]) top--;
		top++;
		if(i==ll) st[top]=mkp(i,0);
		else st[top]=mkp(i,(sum[i-1]-sum[st[top-1].first-1])*(height[i]-k+1)+st[top-1].second);
		if(sa[i]<=len1) ans+=st[top].second;
	}
	return ans;
}

lt solve()
{
	lt ans=0,ll=1;
	for(int i=2;i<=n;++i)
	if(height[i]<k)
	{
		ans+=query(ll,i-1);
		ll=i; 
	}
	ans+=query(ll,n);
	return ans;
}

int main()
{
    while(scanf("%d",&k)!=EOF)
    {
    	if(k==0) break;
		scanf("%s%s",&s1,&s2); 
		len1=strlen(s1); len2=strlen(s2);
    
		for(int i=0;i<len1;++i) a[i+1]=s1[i];
    	a[len1+1]='#';
    	for(int i=0;i<len2;++i) a[i+len1+2]=s2[i];
    
    	n=len1+len2+1;
    	SA(); getH();
    
    	printf("%lld\n",solve());
	}
    return 0;
}

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值