最长重复不重叠子串 poj 1743

原创 2012年03月21日 18:38:47

(资料来自国家集训队论文)

把排序后的后缀分成若干组,其中每组的后缀之间的height 值都

不小于k。例如,字符串为“aabaaaab”,当k=2 时,后缀分成了4 组,如图5所示。


。然
后对于每组后缀,只须判断每个后缀的sa 值的最大值和最小值之差是否不小于
k。如果有一组满足,则说明存在,否则不存在。整个做法的时间复杂度为
O(nlogn)。

//最长重复不重叠子串
#include <iostream>
#include <string>
#include <cmath>
#include <map>
using namespace std;
const int N=30000;
int wa[N],wb[N],wv[N],wsum[N];
int height[N],sa[N],rank[N];
int n;
int str[N];
int cmp(int *r,int a,int b,int l)
{
	return r[a]==r[b] && r[a+l]==r[b+l];
}
void da(int *r,int *sa,int n,int m)
{
	int i,j,p,*x=wa,*y=wb,*t;
	for(i=0;i<m;i++)
		wsum[i]=0;
	for(i=0;i<n;i++)
		wsum[x[i]=r[i]]++;
	for(i=1;i<m;i++)
		wsum[i]+=wsum[i-1];
	for(i=n-1;i>=0;i--)
		sa[--wsum[x[i]]]=i;
	for(j=1,p=1;p<n;j*=2,m=p)
	{
		for(p=0,i=n-j;i<n;i++)
			y[p++]=i;
		for(i=0;i<n;i++)
			if(sa[i]>=j)
				y[p++]=sa[i]-j;
		for(i=0;i<n;i++)
			wv[i]=x[y[i]];
		for(i=0;i<m;i++)
			wsum[i]=0;
		for(i=0;i<n;i++)
			wsum[wv[i]]++;
		for(i=1;i<m;i++)
			wsum[i]+=wsum[i-1];
		for(i=n-1;i>=0;i--)
			sa[--wsum[wv[i]]]=y[i];
		for(t=x,x=y,y=t,p=1,x[sa[0]]=0,i=1;i<n;i++)
			x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++;
	}
}
void calheight(int *r,int *sa,int n)
{
	int i,j,k=0;
	for(i=0;i<=n;i++)
		rank[sa[i]]=i;
	for(i=0;i<n;height[rank[i++]]=k)
		for(k?k--:0,j=sa[rank[i]-1];r[i+k]==r[j+k];k++);
}
bool check(int x)
{
	int i;
	int mmin=N,mmax=0;
	for(i=2;i<=n;i++)
	{
		if(height[i]>=x)
		{
			mmin=sa[i]<mmin?sa[i]:mmin;
			mmax=sa[i]>mmax?sa[i]:mmax;
			if(mmax-mmin>=x)
				return 1;
		}
		else
		{
			mmin=mmax=sa[i];
		}
	}
	return 0;
}
int main()
{
	int i,j,k,l,r,mid;
	int ans;
	while(~scanf("%d",&n) && n)
	{
		for(i=0;i<n;i++)
			scanf("%d",&str[i]);
		for(i=n-1;i>0;i--)
			str[i]=str[i]-str[i-1]+90;
		str[n]=0;
		str[0]=199;
		da(str,sa,n+1,200);
		calheight(str,sa,n);
		ans=0;
		l=1;
		r=n/2;
		ans=0;
		while(l<=r)
		{
			mid=(l+r)>>1;
			if(check(mid))
			{
				ans=mid;
				l=mid+1;
			}
			else
			{
				r=mid-1;
			}
		}
		ans++;
		if(ans<5)
			ans=0;
		printf("%d\n",ans);
	}
	return 0;
}



相关文章推荐

poj 1743 Musical Theme(不可重叠的最长重复子串,后缀数组)

题目:http://poj.org/problem?id=1743 题目大意:就是给你 n 个数字,现在要选取一个子串作为主题,要求,这个主题的长度要 >= 5,然后重复的主题直接不能有重叠的地方,...

poj 1743 Musical Theme(不可重叠最长重复子串)

Musical Theme Time Limit: 1000MS   Memory Limit: 30000K Total Submissions: 19435   ...
  • WEYuLi
  • WEYuLi
  • 2014年11月18日 18:31
  • 488

POJ1743 Musical Theme,后缀数组,最长重复不重叠子串,二分检索答案

开始进入后缀数组的学习。 首先分析输入和题目,可以把数组转化为相邻两个元素的差,然后题目就转化为求最长不重叠子串的长度。 因为数组转化为两个元素的差,所以需要在新数组的最后补上一个元素0,同时最长...
  • neofung
  • neofung
  • 2012年06月02日 16:34
  • 677

[poj1743]不可重叠最长重复子串

懒死了。 http://poj.org/problem?id=1743 题目鲁鲁拉。 (1)不可重叠最长重复子串(pku1743) 给定一个字符串,求最长重复子串,这两个子串不能重叠。 算法...

poj1743Musical Theme【后缀数组求最长不重叠重复子串】楼教主男人八题

Description A musical melody is represented as a sequence of N (1

后缀数组经典题---不可重叠最长重复子串 poj1743

内容也是别处看来的,就不写原创了 题意:有N(1     1.长度至少为5个音符。     2.在乐曲中重复出现。(可能经过转调,“转调”的意思是主题序列中每个音符都被加上或减...

poj1743 Musical Theme(后缀数组--不可重叠最长重复子串+二分)

题目链接:点击打开链接 题意描述:给出一首歌词,找出这首歌的最长主题? 1、主题长度不能小于5 2、在乐曲中重复出现。(可能经过转调,“转调”的意思是主题序列中每个音符都被加上或减去了同一个整数...

POJ 1743 Musical Theme(后缀数组[不可重叠最长重复子串])

POJ 1743 Musical Theme(后缀数组[不可重叠最长重复子串])

POJ 1743 Musical Theme(后缀数组求不可重叠最长重复子串)

转载请注明出处,谢谢http://blog.csdn.net/acm_cxlove/article/details/7854526       by---cxlove 题目:给出一些音符,求出最...

hihoCoder 1407 后缀数组二·重复旋律2 && POJ 1743 Musical Theme(最长不可重叠重复子串问题)

hihoCoder 1407: 描述 小Hi平时的一大兴趣爱好就是演奏钢琴。我们知道一个音乐旋律被表示为长度为 N 的数构成的数列。小Hi在练习过很多曲子以后发现很多作品自身包含一...
  • CillyB
  • CillyB
  • 2017年07月17日 20:07
  • 183
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:最长重复不重叠子串 poj 1743
举报原因:
原因补充:

(最多只允许输入30个字)