Maximum repetition substring POJ

#include<stdio.h>   
#include<string.h>   
#include<algorithm>   
using namespace std;  
  
const int maxn=100005;  
  
//以下为倍增算法求后缀数组   
int wa[maxn],wb[maxn],wv[maxn],Ws[maxn];  
int cmp(int *r,int a,int b,int l)  
{return r[a]==r[b]&&r[a+l]==r[b+l];}  
  
void da(const int *r,int *sa,int n,int m){  
    int i,j,p,*x=wa,*y=wb,*t;   
    for(i=0;i<m;i++) Ws[i]=0;   
    for(i=0;i<n;i++) Ws[x[i]=r[i]]++;   
    for(i=1;i<m;i++) Ws[i]+=Ws[i-1];   
    for(i=n-1;i>=0;i--) sa[--Ws[x[i]]]=i;   
    for(j=1,p=1;p<n;j*=2,m=p){   
        for(p=0,i=n-j;i<n;i++) y[p++]=i;   
        for(i=0;i<n;i++) if(sa[i]>=j) y[p++]=sa[i]-j;   
        for(i=0;i<n;i++) wv[i]=x[y[i]]; //x[]->上次排序的排名   
        for(i=0;i<m;i++) Ws[i]=0;   
        for(i=0;i<n;i++) Ws[wv[i]]++;   
        for(i=1;i<m;i++) Ws[i]+=Ws[i-1];   
        for(i=n-1;i>=0;i--) sa[--Ws[wv[i]]]=y[i];   
        //y[i]->二级排序后第i大的下标,循环从n-1到0由于一级排序相同要看二级排序   
        for(t=x,x=y,y=t,p=1,x[sa[0]]=0,i=1;i<n;i++)   
            x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++;   
    }   
    return;   
}  
int sa[maxn],Rank[maxn],height[maxn];  
//求height数组   
//sa[1,n]取值范围[0,n-1],sa[0]为特殊字符   
//Rank[0,n-1]取值范围[1,n]   
//height[1,n]表示排名相邻的两个后缀的最长公共前缀   
//height[i]表示sa[i]和sa[i-1]的最长前缀 排名为i与i-1的最长公共前缀   
void calheight(const int *r,int *sa,int n){  
    int i,j,k=0;  
    for(i=1;i<=n;i++) Rank[sa[i]]=i;  
    for(i=0;i<n;height[Rank[i++]]=k)  
        for(k?k--:0,j=sa[Rank[i]-1];r[i+k]==r[j+k];k++);  
    return;  
}  
/* 
da(r,sa,n+1,128); 
n+1表示加入特殊字符后的长度[0,n]; 
calheight(r,sa,n); 
去掉特殊字符[1,n]长度,就是输入字符串长度n 
*/  
  
int LOG[maxn];  
int dp[20][maxn];  
  
int Min(int a,int b){  
    if(a<b)return a;  
    return b;  
}  
  
void RMQ(int m){  
    int i,j;  
    LOG[0]=-1;  
    for(i=1;i<=m;i++)  
        LOG[i]=LOG[i>>1]+1;  
    for(i=1;i<=m;i++)  
        dp[0][i]=height[i];  
    for(j=1;j<=LOG[m];j++){  
        int limit=m+1-(1<<j);  
        for(i=1;i<=limit;i++){  
            int x=i+(1<<j>>1);  
            dp[j][i]=Min(dp[j-1][x],dp[j-1][i]);  
        }  
    }  
}  
  
int lcp(int l,int r){  
    l=Rank[l];r=Rank[r];  
    if(l>r){  
        int tmp=l;l=r;r=tmp;  
    }  
    l++;//height[i]表示排名i与i-1的lcp   
    int m=LOG[r-l+1];  
    return Min(dp[m][l],dp[m][r-(1<<m)+1]);  
}  

char b[maxn];
int a[maxn];
int len[maxn];

int main(){
	int cas=1;
	int n,m;
	int i,j;
	while(scanf("%s",b)!=EOF && strcmp(b,"#")){
		n=strlen(b);
		for(i=0;i<n;i++)
			a[i]=b[i]-'a'+1;
		a[n]=0;
		da(a,sa,n+1,30);
		calheight(a,sa,n);
		RMQ(n);
		int max=0;
		int top=0;
		for(i=1;i<=n/2;i++){//枚举重复长度L
			for(j=0;j+i<n;j+=i){
				int k=lcp(j,j+i);
				int r=k/i+1;
				int t=j-(i-k%i);
				if(t>=0 && t+i<n){
					k=lcp(t,t+i)/i+1;
					r=k>r?k:r;
				}
				if(r==max){
					len[top++]=i;//记录重复数为max的不同长度
				}
				if(r>max){
					top=0;
					len[top++]=i;
					max=r;
				}
			}
		}
		int st=sa[1],ed=sa[1]+1;
		for(i=1;i<=n;i++){ //枚举字典序大小
			for(j=0;j<top ;j++){
				if(sa[i]+len[j]<n && lcp(sa[i],sa[i]+len[j])>=(max-1)*len[j]){
					//一旦重复数==max 即使长度重复(max-1)*len[j] break 
					st=sa[i];
					ed=sa[i]+max*len[j];
					i=n;
					break;
				}
			}
		}
		printf("Case %d: ",cas++);
		for(i=st;i<ed;i++)printf("%c",b[i]);
		puts("");
	}
	return 0;
}

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值