题目:
题意:
有N(1 <= N <=20000)个音符的序列来表示一首乐曲,每个音符都是1..88范围内的整数,现在要找一个重复的主题。“主题”是整个音符序列的一个子串,它需要满足如下条件:
- 1.长度至少为5个音符。
- 2.在乐曲中重复出现。(可能经过转调,“转调”的意思是主题序列中每个音符都被加上或减去了同一个整数值)
- 3.重复出现的同一主题不能有公共部分。
题解:
最长不重叠的至少重复两次的子串
先二分答案,判断是否存在两个长度为mid的子串是相同的,且不重叠。把排序后的后缀分成若干组,其中每组的后缀之间的 height 值都不小于 mid。 然后对于每组后缀,只须判断每个后缀的 sa 值的最大值和最小值之差是否不小于 mid 。如果有一组满足,则说明存在,否则不存在。
那么对于这道题来说,既然ta允许转调,我们就用后面的-前面的,求一个delta,那么我们只需要求一个不重叠且相同的delta序列就好啦
代码:
#include <cstdio>
#include <cstring>
#include <iostream>
using namespace std;
const int base=100;
const int N=30000;
int c[N],sa[N],s[N],x[N],y[N],m,n,rank[N],height[N];
void build_sa()
{
m=300;
for (int i=0;i<m;i++) c[i]=0;
for (int i=0;i<n;i++) c[x[i]=s[i]]++;
for (int i=1;i<m;i++) c[i]+=c[i-1];
for (int i=n-1;i>=0;i--) sa[--c[x[i]]]=i;
for (int k=1;k<=n;k<<=1)
{
int p=0;
for (int i=n-k;i<n;i++) y[p++]=i;
for (int i=0;i<n;i++) if (sa[i]>=k) y[p++]=sa[i]-k;
for (int i=0;i<m;i++) c[i]=0;
for (int i=0;i<n;i++) c[x[y[i]]]++;
for (int i=1;i<m;i++) c[i]+=c[i-1];
for (int i=n-1;i>=0;i--) sa[--c[x[y[i]]]]=y[i];
swap(x,y);
p=1; x[sa[0]]=0;
for (int i=1;i<n;i++) x[sa[i]]=y[sa[i]]==y[sa[i-1]]&&((sa[i]+k>=n?-1:y[sa[i]+k])==(sa[i-1]+k>=n?-1:y[sa[i-1]+k]))?p-1:p++;
if (p>n) break;
m=p;
}
}
void build_lcp()
{
for (int i=0;i<n;i++) rank[sa[i]]=i;
height[0]=0;
int k=0;
for (int i=0;i<n;i++)
{
if (!rank[i]) continue;
if (k) k--;
int j=sa[rank[i]-1];
while (i+k<n && j+k<n && s[i+k]==s[j+k]) k++;
height[rank[i]]=k;
}
}
bool check(int mid)
{
int maxx=-1,minn=n;
for (int i=0;i<n;i++)
if (height[i]>=mid)
{
maxx=max(maxx,max(sa[i-1],sa[i]));
minn=min(minn,min(sa[i-1],sa[i]));
if (maxx-minn>=mid) return 1;
}else maxx=-1,minn=n;
return 0;
}
int main()
{
while (~scanf("%d",&n))
{
if (!n) break;
for (int i=0;i<n;i++) scanf("%d",&s[i]);
for (int i=1;i<n;i++) s[i-1]=s[i]-s[i-1]+base;
n--;
build_sa();
build_lcp();
int l=4,r=n,ans=-1;
while (l<=r)
{
int mid=(l+r)>>1;
if (check(mid)) ans=mid,l=mid+1;
else r=mid-1;
}
printf("%d\n",ans+1);
}
}