后缀数组二·重复旋律2
时间限制:5000ms
单点时限:1000ms
内存限制:256MB
描述
小Hi平时的一大兴趣爱好就是演奏钢琴。我们知道一个音乐旋律被表示为长度为 N 的数构成的数列。小Hi在练习过很多曲子以后发现很多作品自身包含一样的旋律。
旋律可以表示为一段连续的数列,相似的旋律在原数列不可重叠,比如在1 2 3 2 3 2 1 中 2 3 2 出现了一次,2 3 出现了两次,小Hi想知道一段旋律中出现次数至少为两次的旋律最长是多少?
输入
第一行一个整数 N。1≤N≤100000
接下来有 N 个整数,表示每个音的数字。1≤数字≤1000
输出
一行一个整数,表示答案。
样例输入
8 1 2 3 2 3 2 3 1
样例输出
2
题目大意:求出不重叠的至少出现两次的长度最长的子串。
解题思路:省赛选拔貌似出了这个题目,当时不会后缀数组,现在还是不会,只是知道了
三个数组的含义是什么就开始做题了。。。
容易想到二分答案然后check。
如何check:对于二分的一个长度,对于连续的height[i]>=k ,我们只要判断最大的sa 和最小的sa的差值是
不是大于等于k就可以了。因为sa代表后缀的起始位置,如果相差大于等于k说明没有重叠。
#include<stdio.h>
#include<string.h>
#include<algorithm>
#include<vector>
#include<iostream>
using namespace std;
const int maxn = 20005*6; //空间开6倍
int wa[maxn],wb[maxn],wv[maxn],Ws[maxn];
int rak[maxn],height[maxn];
int sa[maxn];
int s[maxn];
/// sa[i] 排第i的是哪个串 rak[i] 第i个串排第几
/// sa[1~n]有效 rak[0~n-1]有效
/// 定义 height[i]为suffix(sa[i-1])和 suffix(sa[i]),即排名相邻的后缀的最长公共前缀
/// height[2~n]有效
int cmp(int *r,int a,int b,int l)
{
return r[a]==r[b]&&r[a+l]==r[b+l];
}
///m是计数排序上限 r是要处理的数组
///n是数组长度+1,最后一个元素的后一个位置
///计数排序最小元素从1开始
/// m的范围 如果字符串只包含字母就取128 否则取最大的数字+1。
void init()
{
memset(wa,0,sizeof(wa));
memset(wb,0,sizeof(wb));
memset(wv,0,sizeof(wv));
memset(Ws,0,sizeof(Ws));
memset(rak,0,sizeof(rak));
memset(height,0,sizeof(height));
memset(sa,0,sizeof(sa));
}
void da(int *r,int *sa,int n,int m) {
int i,j,p,*x=wa,*y=wb,*t;
for(i=0; i<m; i++) Ws[i]=0;
for(i=0; i<n; i++) Ws[x[i]=r[i]]++;
for(i=1; i<m; i++) Ws[i]+=Ws[i-1];
for(i=n-1; i>=0; i--) sa[--Ws[x[i]]]=i;
for(p=1,j=1; p<n; j*=2,m=p)
{
for(p=0,i=n-j; i<n; i++) y[p++]=i;
for(i=0; i<n; i++) if(sa[i]>=j) y[p++]=sa[i]-j;
for(i=0; i<n; i++) wv[i]=x[y[i]];
for(i=0; i<m; i++) Ws[i]=0;
for(i=0; i<n; i++) Ws[wv[i]]++;
for(i=1; i<m; i++) Ws[i]+=Ws[i-1];
for(i=n-1; i>=0; i--) sa[--Ws[wv[i]]]=y[i];
for(t=x,x=y,y=t,p=1,x[sa[0]]=0,i=1; i<n; i++ )
x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++;
}
}
void calheight(int *r,int *sa,int n)
{
int i,j,k=0;
for(i=1; i<=n; i++)
rak[sa[i]]=i;
for(i=0; i<n; height[rak[i++]]=k)
for(k?k--:0,j=sa[rak[i]-1]; r[i+k]==r[j+k]; k++);
}
vector<int>lisan;
bool ok(int n, int vak)
{
int mini;
int mamx;
for(int i=1; i<=n;)
{
if(height[i]<vak)
{
mini = sa[i];
mamx = sa[i];
}
while(height[i]>=vak &&i<=n)
{
mini = min(mini,sa[i]);
mamx = max(mamx,sa[i]);
i++;
}
i++;
if(mamx-mini>=vak)return true;
}
return false;
}
void read()
{
int n;
cin>>n;
for(int i=0; i<n; i++) scanf("%d",s+i);
s[n] = 0;
da(s, sa, n+1, 1001);
calheight(s, sa, n);
int l =1, r =n-1;
int ans=0;
while(l<=r)
{
int mid = (l+r)>>1;
if(ok(n,mid)) l = mid+1,ans=mid;
else r= mid-1;
}
printf("%d\n",ans);
}
int main()
{
read();
}