BZOJ4566[HAOI2016]找相同字符
Time Limit: 20 Sec
Memory Limit: 256 MB
Description
给定两个字符串,求出在两个字符串中各取出一个子串使得这两个子串相同的方案数。两个方案不同当且仅当这两个子串中有一个位置不同。
Input
两行,两个字符串s1,s2,长度分别为n1,n2。1 <=n1, n2<= 200000,字符串中只有小写字母
Output
输出一个整数表示答案
题目分析
首先容易想到最直观的思路
枚举s1和s2的所有后缀,两两求lcp长度,所有lcp的和就是答案
利用height数组直接枚举复杂度是
O
(
n
2
)
O(n^2)
O(n2)
显然直接枚举一定T爆,我们尝试在上述思路上优化
首先想想枚举的过程是什么,即在height数组上求
每个属于s1的后缀,它与前面属于s2的后缀的lcp长度和
AND 每个属于s2的后缀,它与前面属于s1的后缀的lcp长度和
我们以前者为例讲解 (即设当前枚举位置为height[i],且sa[i]属于s1)
"每个属于s1的后缀,它与前面属于s2的后缀的lcp长度和"可以转化为两部分
1.
i
i
i前面第一个
h
e
i
g
h
t
height
height值小于
h
e
i
g
h
t
[
i
]
height[i]
height[i]的位置
j
j
j到
i
i
i区间内属于s2的后缀数量 乘 height[i]
因为除去
h
e
i
g
h
t
[
j
]
height[j]
height[j]这个值后这段区间内最小的
h
e
i
g
h
t
height
height就是
h
e
i
g
h
t
[
i
]
height[i]
height[i]
所以区间内所有属于s2的后缀与
s
a
[
i
]
sa[i]
sa[i]这个后缀lcp长度都是
h
e
i
g
h
t
[
i
]
height[i]
height[i]
2.
j
j
j位置的答案总和
即求出
s
a
[
i
]
sa[i]
sa[i]这个后缀与
j
j
j位置前所有属于s2的后缀的lcp总和
到这里用单调栈维护已经很明显了
对s1的后缀和s2的后缀分别扫一次即可
#include<iostream>
#include<cmath>
#include<algorithm>
#include<map>
#include<cstring>
#include<cstdio>
using namespace std;
typedef long long lt;
#define pir pair<int,lt>
#define mkp(x,y) make_pair(x,y)
int read()
{
int f=1,x=0;
char ss=getchar();
while(ss<'0'||ss>'9'){if(ss=='-')f=-1;ss=getchar();}
while(ss>='0'&&ss<='9'){x=x*10+ss-'0';ss=getchar();}
return f*x;
}
const int maxn=500010;
char s1[maxn],s2[maxn];
int n,m,len1,len2;
int a[maxn];
int rak[maxn],sa[maxn],tp[maxn],tax[maxn];
int height[maxn];
pir st[maxn];
lt top,sum[maxn];
void rsort()
{
for(int i=0;i<=m;++i) tax[i]=0;
for(int i=1;i<=n;++i) tax[rak[i]]++;
for(int i=1;i<=m;++i) tax[i]+=tax[i-1];
for(int i=n;i>=1;--i) sa[tax[rak[tp[i]]]--]=tp[i];
}
void SA()
{
m=256;
for(int i=1;i<=n;++i)
rak[i]=a[i],tp[i]=i;
rsort();
for(int k=1;k<=n;k<<=1)
{
int p=0;
for(int i=n-k+1;i<=n;++i) tp[++p]=i;
for(int i=1;i<=n;++i) if(sa[i]>k) tp[++p]=sa[i]-k;
rsort();
swap(rak,tp);
rak[sa[1]]=p=1;
for(int i=2;i<=n;++i)
rak[sa[i]]=(tp[sa[i]]==tp[sa[i-1]]&&tp[sa[i]+k]==tp[sa[i-1]+k])?p:++p;
if(p>=n) break;
m=p;
}
}
void getH()
{
int k=0;
for(int i=1;i<=n;++i)
{
if(k) --k;
int j=sa[rak[i]-1];
while(a[i+k]==a[j+k]) k++;
height[rak[i]]=k;
}
}
lt solve()
{
lt ans=0;
for(int i=1;i<=n;++i)
sum[i]=sum[i-1]+(sa[i]<=len1);
for(int i=1;i<=n;++i)
{
while(top&&height[i]<height[st[top].first]) top--;
top++;
if(i==1) st[top]=mkp(i,0);
else st[top]=mkp(i,(sum[i-1]-sum[st[top-1].first-1])*height[i]+st[top-1].second);
if(sa[i]>len1+1) ans+=st[top].second;
}
top=0;
for(int i=1;i<=n;++i)
sum[i]=sum[i-1]+(sa[i]>len1+1);
for(int i=1;i<=n;++i)
{
while(top&&height[i]<height[st[top].first]) top--;
top++;
if(i==1) st[top]=mkp(i,0);
else st[top]=mkp(i,(sum[i-1]-sum[st[top-1].first-1])*height[i]+st[top-1].second);
if(sa[i]<=len1) ans+=st[top].second;
}
return ans;
}
int main()
{
scanf("%s%s",&s1,&s2);
len1=strlen(s1); len2=strlen(s2);
for(int i=0;i<len1;++i) a[i+1]=s1[i];
a[len1+1]='#';
for(int i=0;i<len2;++i) a[i+len1+2]=s2[i];
n=len1+len2+1;
SA(); getH();
printf("%lld",solve());
return 0;
}
POJ - 3415 Common Substrings
Time limit 5000 ms
Memory limit 65536 kB
A substring of a string T is defined as:
T( i, k)= TiTi +1… Ti+k -1, 1≤ i≤ i+k-1≤| T|.
Given two strings A, B and one integer K, we define S, a set of triples (i, j, k):
S = {( i, j, k) | k≥ K, A( i, k)= B( j, k)}.
You are to give the value of |S| for specific A, B and K.
Input
The input file contains several blocks of data. For each block, the first line contains one integer K, followed by two lines containing strings A and B, respectively. The input file is ended by K=0.
1 ≤ |A|, |B| ≤ 105
1 ≤ K ≤ min{|A|, |B|}
Characters of A and B are all Latin letters.
Output
For each case, output an integer |S|.
题目分析
题意和上题基本一致,但要求子串长度大于等于k
只要在height上按k值分组,对每组按上一题的方法求答案最后累加即可
注意这里若lcp长度为
h
e
i
g
h
t
[
i
]
height[i]
height[i]
每一对贡献的数量应该是
h
e
i
g
h
t
[
i
]
−
k
+
1
height[i]-k+1
height[i]−k+1
#include<iostream>
#include<cmath>
#include<algorithm>
#include<map>
#include<cstring>
#include<cstdio>
using namespace std;
typedef long long lt;
#define pir pair<int,lt>
#define mkp(x,y) make_pair(x,y)
int read()
{
int f=1,x=0;
char ss=getchar();
while(ss<'0'||ss>'9'){if(ss=='-')f=-1;ss=getchar();}
while(ss>='0'&&ss<='9'){x=x*10+ss-'0';ss=getchar();}
return f*x;
}
const int maxn=500010;
char s1[maxn],s2[maxn];
int n,m,len1,len2,k;
int a[maxn];
int rak[maxn],sa[maxn],tp[maxn],tax[maxn];
int height[maxn];
pir st[maxn];
lt top,sum[maxn];
void rsort()
{
for(int i=0;i<=m;++i) tax[i]=0;
for(int i=1;i<=n;++i) tax[rak[i]]++;
for(int i=1;i<=m;++i) tax[i]+=tax[i-1];
for(int i=n;i>=1;--i) sa[tax[rak[tp[i]]]--]=tp[i];
}
void SA()
{
m=256;
for(int i=1;i<=n;++i)
rak[i]=a[i],tp[i]=i;
rsort();
for(int k=1;k<=n;k<<=1)
{
int p=0;
for(int i=n-k+1;i<=n;++i) tp[++p]=i;
for(int i=1;i<=n;++i) if(sa[i]>k) tp[++p]=sa[i]-k;
rsort();
swap(rak,tp);
rak[sa[1]]=p=1;
for(int i=2;i<=n;++i)
rak[sa[i]]=(tp[sa[i]]==tp[sa[i-1]]&&tp[sa[i]+k]==tp[sa[i-1]+k])?p:++p;
if(p>=n) break;
m=p;
}
}
void getH()
{
int k=0;
for(int i=1;i<=n;++i)
{
if(k) --k;
int j=sa[rak[i]-1];
while(a[i+k]==a[j+k]) k++;
height[rak[i]]=k;
}
}
lt query(int ll,int rr)
{
if(ll==rr) return 0;
lt ans=0;
top=sum[ll-1]=0;
for(int i=ll;i<=rr;++i)
sum[i]=sum[i-1]+(sa[i]<=len1);
for(int i=ll;i<=rr;++i)
{
while(top&&height[i]<height[st[top].first]) top--;
top++;
if(i==ll) st[top]=mkp(i,0);
else st[top]=mkp(i,(sum[i-1]-sum[st[top-1].first-1])*(height[i]-k+1)+st[top-1].second);
if(sa[i]>len1+1) ans+=st[top].second;
}
top=0;
for(int i=ll;i<=rr;++i)
sum[i]=sum[i-1]+(sa[i]>len1+1);
for(int i=ll;i<=rr;++i)
{
while(top&&height[i]<height[st[top].first]) top--;
top++;
if(i==ll) st[top]=mkp(i,0);
else st[top]=mkp(i,(sum[i-1]-sum[st[top-1].first-1])*(height[i]-k+1)+st[top-1].second);
if(sa[i]<=len1) ans+=st[top].second;
}
return ans;
}
lt solve()
{
lt ans=0,ll=1;
for(int i=2;i<=n;++i)
if(height[i]<k)
{
ans+=query(ll,i-1);
ll=i;
}
ans+=query(ll,n);
return ans;
}
int main()
{
while(scanf("%d",&k)!=EOF)
{
if(k==0) break;
scanf("%s%s",&s1,&s2);
len1=strlen(s1); len2=strlen(s2);
for(int i=0;i<len1;++i) a[i+1]=s1[i];
a[len1+1]='#';
for(int i=0;i<len2;++i) a[i+len1+2]=s2[i];
n=len1+len2+1;
SA(); getH();
printf("%lld\n",solve());
}
return 0;
}