POJ 1743 Musical Theme ( 后缀数组 + 二分 不可重叠最长重复子串 )

题意 : 给你段旋律 , 要你找出其中的最长的主旋律 ,主旋律要求要满足长度大于5 , 并且至少出现两次 , 而且不能重叠 。两段旋律不一定要完全一样 , 可以是共同加上或减去某一个值

( 比如 1 , 2 , 3 , 4 , 5 , 6 ,7 ,8 ,9 ,10 这段旋律 , 那么最长的主旋律为5 , 分别是 1 , 2 , 3 , 4 , 5 和 6, 7 , 8, 9, 10 ) .


思路 : 将旋律的后面一个减去前面一个,形成一个新的长度为 n - 1 的新旋律 , 然后问题转化为求这段新旋律的最长不重叠重复子串 。那么如何求最长不重叠重复子串,先二分子串的长度, 然后问题转化为是否有长度为mid的不重叠重复子串的判定性问题 。那么解决这个判定性问题就需要用到height数组 , 我们把排序后的后缀根据height数组分组,使得每组的任意两个后缀的LCP都大于等于mid ( 若height[i] < mid ,那么i就是两组的分界线,sa[i-1] 属于上一组 , sa[i] 属于这一组 ) 。

下面这个是论文中的图 , 这样分组可以理解得更清楚一点 




那么分完组之后,就判断每组中sa[i]的最大值和最小值差值是否大于mid即可。

最后在求得的答案上加上1即可。


可惜这样做还是有些问题的( 虽然这么做在POJ 上面可以AC ) 。

比如长度为 9 的一段旋律

  1 2 3 4 5 6 7 8 9

做差之后为

  1 1 1 1 1 1 1 1

很明显,最长不重叠重复子串的长度为 4 , 那么最后的答案就应该是5 ... 事实上答案应该是 0 , 根本就是没有两段长度为5的不重叠子串 。

当我们计算出最长不重叠重复子串的长度为4时 ,其实对应的是 1 2 3 4 5 和 5 6 7 8 9 这两段旋律 , 在做差之后虽然不重叠 , 但还原回去之后就重叠了

所以在判定是否存在长度为mid的子串的时候,应该是每组中的sa[i]的最大值和最小差值要严格大于mid才对

#include <stdio.h>
#include <string.h>
#include <algorithm>
using namespace std;

#define maxn 20005
int wa[maxn],wb[maxn],wv[maxn],ws[maxn];

int cmp(int *r,int a,int b,int l)
{return r[a]==r[b]&&r[a+l]==r[b+l];}

void da(int *r,int *sa,int n,int m){
	int i,j,p,*x=wa,*y=wb,*t;
	for(i=0;i<m;i++) ws[i]=0;
	for(i=0;i<n;i++) ws[x[i]=r[i]]++;
	for(i=1;i<m;i++) ws[i]+=ws[i-1];
	for(i=n-1;i>=0;i--) sa[--ws[x[i]]]=i;
	for(j=1,p=1;p<n;j*=2,m=p){
		for(p=0,i=n-j;i<n;i++) y[p++]=i;
		for(i=0;i<n;i++) if(sa[i]>=j) y[p++]=sa[i]-j;
		for(i=0;i<n;i++) wv[i]=x[y[i]];
		for(i=0;i<m;i++) ws[i]=0;
		for(i=0;i<n;i++) ws[wv[i]]++;
		for(i=1;i<m;i++) ws[i]+=ws[i-1];
		for(i=n-1;i>=0;i--) sa[--ws[wv[i]]]=y[i];
		for(t=x,x=y,y=t,p=1,x[sa[0]]=0,i=1;i<n;i++)
			x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++;
	}
}

int Rank[maxn],height[maxn];

void calheight(int *r,int *sa,int n){
	int i , j , k = 0 ;
	for( i=1 ; i<=n ; i++ ) Rank[sa[i]]=i;
	for(i=0;i<n;i++) {
		if(k)k--;
		int j = sa[Rank[i]-1];
		while(r[i+k]==r[j+k]) k++ ;
		height[Rank[i]] = k ;
	}	
	return;
}

int r[maxn] , sa[maxn] ;
int a[maxn] ;

bool check( int k , int n ) {
	int Max = sa[1] , Min = sa[1] ;
	for( int i = 2 ; i <= n ; i ++ ) {
		if( height[i] < k ) {
                        // 注意这里 , 如果是求最大不重叠重复子串的话,这里应该>=k,但这题因为是要还原回去也不重叠,
                        // 因此要多一个字符才行
                        if( Max - Min > k ) return true ;
			Max = sa[i] , Min = sa[i] ;
		}else{
			Max = max( Max , sa[i] ) ;
			Min = min( Min , sa[i] ) ;
		}
	}
	if( Max - Min > k ) return true ;
	return false ;
}

int main(){
	int n ; 
	while( scanf( "%d" , &n ) && n ) {
		for( int i = 0 ; i < n ; i ++ )
			scanf( "%d" , &a[i] ) ;
		if( n == 1 ) {
			puts( "0" ) ;
			continue ;
		}
		for( int i = 0 ; i < n - 1 ; i ++ ) 
			r[i] = a[i+1] - a[i] + 90 ; 
		r[n-1] = 0 ;
		n -- ;
		da( r , sa , n + 1 , 180 ) ;
		calheight( r , sa , n ) ;
		int L = 1 , R = n / 2 ; 
		int m ;
		while( L < R ) {
			m = ( L + R + 1 ) >> 1 ;
			if( check( m , n ) ) {
				L = m ;
			} else {
				R = m - 1 ;
			}
		}
		if( L >= 4 ) {
			printf( "%d\n" , L + 1 ) ;
		} else {
			puts( "0" ) ;
		}
	}
	return 0 ;
}


  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值