最长重复不重叠子串 poj 1743

原创 2012年03月21日 18:38:47

(资料来自国家集训队论文)

把排序后的后缀分成若干组,其中每组的后缀之间的height 值都

不小于k。例如,字符串为“aabaaaab”,当k=2 时,后缀分成了4 组,如图5所示。


。然
后对于每组后缀,只须判断每个后缀的sa 值的最大值和最小值之差是否不小于
k。如果有一组满足,则说明存在,否则不存在。整个做法的时间复杂度为
O(nlogn)。

//最长重复不重叠子串
#include <iostream>
#include <string>
#include <cmath>
#include <map>
using namespace std;
const int N=30000;
int wa[N],wb[N],wv[N],wsum[N];
int height[N],sa[N],rank[N];
int n;
int str[N];
int cmp(int *r,int a,int b,int l)
{
	return r[a]==r[b] && r[a+l]==r[b+l];
}
void da(int *r,int *sa,int n,int m)
{
	int i,j,p,*x=wa,*y=wb,*t;
	for(i=0;i<m;i++)
		wsum[i]=0;
	for(i=0;i<n;i++)
		wsum[x[i]=r[i]]++;
	for(i=1;i<m;i++)
		wsum[i]+=wsum[i-1];
	for(i=n-1;i>=0;i--)
		sa[--wsum[x[i]]]=i;
	for(j=1,p=1;p<n;j*=2,m=p)
	{
		for(p=0,i=n-j;i<n;i++)
			y[p++]=i;
		for(i=0;i<n;i++)
			if(sa[i]>=j)
				y[p++]=sa[i]-j;
		for(i=0;i<n;i++)
			wv[i]=x[y[i]];
		for(i=0;i<m;i++)
			wsum[i]=0;
		for(i=0;i<n;i++)
			wsum[wv[i]]++;
		for(i=1;i<m;i++)
			wsum[i]+=wsum[i-1];
		for(i=n-1;i>=0;i--)
			sa[--wsum[wv[i]]]=y[i];
		for(t=x,x=y,y=t,p=1,x[sa[0]]=0,i=1;i<n;i++)
			x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++;
	}
}
void calheight(int *r,int *sa,int n)
{
	int i,j,k=0;
	for(i=0;i<=n;i++)
		rank[sa[i]]=i;
	for(i=0;i<n;height[rank[i++]]=k)
		for(k?k--:0,j=sa[rank[i]-1];r[i+k]==r[j+k];k++);
}
bool check(int x)
{
	int i;
	int mmin=N,mmax=0;
	for(i=2;i<=n;i++)
	{
		if(height[i]>=x)
		{
			mmin=sa[i]<mmin?sa[i]:mmin;
			mmax=sa[i]>mmax?sa[i]:mmax;
			if(mmax-mmin>=x)
				return 1;
		}
		else
		{
			mmin=mmax=sa[i];
		}
	}
	return 0;
}
int main()
{
	int i,j,k,l,r,mid;
	int ans;
	while(~scanf("%d",&n) && n)
	{
		for(i=0;i<n;i++)
			scanf("%d",&str[i]);
		for(i=n-1;i>0;i--)
			str[i]=str[i]-str[i-1]+90;
		str[n]=0;
		str[0]=199;
		da(str,sa,n+1,200);
		calheight(str,sa,n);
		ans=0;
		l=1;
		r=n/2;
		ans=0;
		while(l<=r)
		{
			mid=(l+r)>>1;
			if(check(mid))
			{
				ans=mid;
				l=mid+1;
			}
			else
			{
				r=mid-1;
			}
		}
		ans++;
		if(ans<5)
			ans=0;
		printf("%d\n",ans);
	}
	return 0;
}



poj 1743 Musical Theme(最长不重叠重复子串 后缀数组+二分)

题目:http://poj.org/problem?id=1743 题意:给你一个序列,求序列里长度至少为5的最长不重叠重复子串,这里的重复包括每个元素加减相同的值 分析:对于区间加减可以通过将相...
  • fp_hzq
  • fp_hzq
  • 2013年05月30日 16:12
  • 2117

POJ - 1743 Musical Theme (后缀数组求不可重叠最长重复子串)

Description A musical melody is represented as a sequence of N (1
  • u011345136
  • u011345136
  • 2014年09月25日 20:55
  • 1081

poj 1743 男人八题之后缀数组求最长不可重叠最长重复子串

Musical Theme Time Limit: 1000MS   Memory Limit: 30000K Total Submissions: 14874   Accepted: 5...
  • hnust_xiehonghao
  • hnust_xiehonghao
  • 2013年07月14日 12:58
  • 1647

POJ - 1743 - Musical Theme(后缀数组 - 不可重叠最长重复子串)

Musical Theme Time Limit: 1000MS   Memory Limit: 30000K Total Submissions: 26260   Accepted: 8...
  • j6635788
  • j6635788
  • 2016年08月12日 14:29
  • 98

poj 1743 字符串 后缀数组 不可重叠最长重复子串

题意:有N个音符的序列来表示一首乐曲,每个音符都是1..88范围内的整数,现在要找一个重复的主题。“主题”是整个音符序列的一个子串,它需要满足如下条件:     1.长度至少为5个音符。   ...
  • azheng51714
  • azheng51714
  • 2013年01月24日 11:20
  • 316

poj 1743 Musical Theme(不可重叠的最长重复子串,后缀数组)

题目:http://poj.org/problem?id=1743 题目大意:就是给你 n 个数字,现在要选取一个子串作为主题,要求,这个主题的长度要 >= 5,然后重复的主题直接不能有重叠的地方,...
  • u010794465
  • u010794465
  • 2013年10月22日 10:07
  • 576

[poj1743]不可重叠最长重复子串

懒死了。 http://poj.org/problem?id=1743 题目鲁鲁拉。 (1)不可重叠最长重复子串(pku1743) 给定一个字符串,求最长重复子串,这两个子串不能重叠。 算法...
  • huangzhengdoc
  • huangzhengdoc
  • 2016年12月11日 15:09
  • 593

poj1743(后缀数组+二分--不可重叠最长重复子串)

题目:Musical Theme                                                                                    ...
  • ACdreamers
  • ACdreamers
  • 2013年06月17日 00:13
  • 1401

POJ1743 Musical Theme,后缀数组,最长重复不重叠子串,二分检索答案

开始进入后缀数组的学习。 首先分析输入和题目,可以把数组转化为相邻两个元素的差,然后题目就转化为求最长不重叠子串的长度。 因为数组转化为两个元素的差,所以需要在新数组的最后补上一个元素0,同时最长...
  • neofung
  • neofung
  • 2012年06月02日 16:34
  • 701

poj 1743 后缀数组+二分答案 求一个串的最长无重叠的重复出现次数最多的子串

Description A musical melody is represented as a sequence of N (1
  • winycg
  • winycg
  • 2016年11月04日 19:30
  • 167
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:最长重复不重叠子串 poj 1743
举报原因:
原因补充:

(最多只允许输入30个字)