题目链接:http://poj.org/problem?id=1743
题目大意:有N(1<=N<=20000)个音符的序列来表示一首乐曲,每个音符都是1..88范围内的整数,现在要找一个重复的子串,它需要满足如下条件:1.长度至少为5个音符。
2.在乐曲中重复出现(就是出现过至少两次)。(可能经过转调,“转调”的意思是主题序列中每个音符都被加上或减去了同一个整数值)
3.重复出现的同一主题不能有公共部分。
题解:这道题是罗大神论文里的一道题,求不重复的最长子串。跑完倍增之后,二分答案,用h[]分组来验证。嗯是基本应用之一。可能有个难点就是对“转调”的处理,其实很容易可以发现同加同减的话差值还是不变,所以把原串变为两两间的差值再做sa
#include<cstdio>
#include<cstdlib>
#include<cstring>
#include<iostream>
#include<algorithm>
using namespace std;
#define maxn 20100
int sa[maxn],rk[maxn],s[maxn],n;
int Rsort[maxn],y[maxn],wr[maxn],h[maxn];
int mymin(int x,int y){return (x<y)?x:y;}
int mymax(int x,int y){return (x>y)?x:y;}
bool cmp(int x,int y,int ln){return (wr[x]==wr[y])&&(wr[x+ln]==wr[y+ln]);}
void get_h()
{
int i,k=0;
for (i=1;i<=n;i++)
{
int j=sa[rk[i]-1];
if (k>0) k--;
while (s[i+k]==s[j+k]) k++;
h[rk[i]]=k;
}
}
void get_sa()
{
int i,k,p,ln,m=200;
for (i=1;i<=n;i++) rk[i]=s[i];
for (i=0;i<=m;i++) Rsort[i]=0;
for (i=1;i<=n;i++) Rsort[rk[i]]++;
for (i=1;i<=m;i++) Rsort[i]+=Rsort[i-1];
for (i=n;i>=1;i--) sa[Rsort[rk[i]]--]=i;
ln=1;p=0;
while (p<n)
{
for (k=0,i=n-ln+1;i<=n;i++) y[++k]=i;
for (i=1;i<=n;i++) if (sa[i]-ln>0) y[++k]=sa[i]-ln;
for (i=1;i<=n;i++) wr[i]=rk[y[i]];
for (i=0;i<=m;i++) Rsort[i]=0;
for (i=1;i<=n;i++) Rsort[wr[i]]++;
for (i=1;i<=m;i++) Rsort[i]+=Rsort[i-1];
for (i=n;i>=1;i--) sa[Rsort[wr[i]]--]=y[i];
memcpy(wr,rk,sizeof(wr));
p=1;rk[sa[1]]=1;
for (i=2;i<=n;i++)
{
if (!cmp(sa[i],sa[i-1],ln)) p++;
rk[sa[i]]=p;
}m=p;ln*=2;
}sa[0]=s[0]=0;
}
int main()
{
//freopen("a.in","r",stdin);
//freopen("a.out","w",stdout);
int i,L,R,mid,mn,mx,ret;
while (1)
{
scanf("%d",&n);
if (n==0) break;
for (i=1;i<=n;i++) scanf("%d",&s[i]);
for (i=n;i>=1;i--) s[i]=(s[i]-s[i-1])+88;
get_sa();get_h();//求sa[]、h[]
L=1;R=n;ret=0;
while (L<R)//二分
{
mid=(L+R)>>1;
bool bk=0;mn=n+1;mx=0;
for (i=1;i<=n;i++)
if (h[i]<mid) mx=mn=sa[i];
else
{
mx=mymax(mx,sa[i]);
mn=mymin(mn,sa[i]);
if (mx-mn>mid) {bk=1;break;}//要求不重叠
}
if (bk) {L=mid+1;ret=mymax(ret,mid);}
else R=mid;
}ret++;//因为是用差值做的所以长度要+1
if (ret<5) ret=0;
printf("%d\n",ret);
}
return 0;
}