[pku3261]可重叠的k次最长重复子串

最新推荐文章于 2019-08-20 10:21:00 发布

正汰

最新推荐文章于 2019-08-20 10:21:00 发布

阅读量1k

点赞数 2

分类专栏：后缀数组 POJ C++算法大全文章标签： poj 后缀数组

本文链接：https://blog.csdn.net/huangzhengdoc/article/details/53637816

版权

C++算法大全同时被 3 个专栏收录

87 篇文章 41 订阅

订阅专栏

POJ

14 篇文章 0 订阅

订阅专栏

后缀数组

7 篇文章 0 订阅

订阅专栏

还是很懒，今天要贴很多代码就允许我懒一些吧。
给定一个字符串，求至少出现k次的最长重复子串，这k个子串可重叠。
算法分析：

这题的做法和上一题差不多，也是先二分答案，然后将后缀分成若干组。不同的是，这里要判断的是有没有一个组的后缀个数不小于k。如果有，那么存在k个相同的子串满足条件，否则不存在。这个做法的时间复杂度为O(nlogn)。

#include<cmath>
#include<cstdio>
#include<cstdlib>
#include<cstring>
#include<iostream>
#include<algorithm>
using namespace std;
int a[210000],wr[210000],mc[210000],JS[210000],sa[210000],y[210000],height[210000];
bool cmp(int k1,int k2,int ln){
    return wr[k1]==wr[k2]&&wr[k1+ln]==wr[k2+ln];
}
void get_sa(int n,int m){//构建SA后缀数组
    int i,k,p,ln;
    //memcpy(mc,a,sizeof(a)); 
    for(i=1;i<=n;i++)mc[i]=a[i];
    //a数组:原字符串，mc名次数组
    for(i=0;i<=m;i++)JS[i]=0; 
    for(i=1;i<=n;i++)JS[mc[i]]++;
    for(i=1;i<=m;i++)JS[i]+=JS[i-1];
    for(i=n;i>=1;i--)sa[JS[mc[i]]--]=i;  
    //以上四句为基数排序，不懂的看flash
    ln=1;p=0; 
    //ln为当前子串的长度,p表示有多少不相同的子串
    while(p<n){
        for(k=0,i=n-ln+1;i<=n;i++)y[++k]=i;
        for(i=1;i<=n;i++)if(sa[i]-ln>0)y[++k]=sa[i]-ln;
        for(i=1;i<=n;i++)wr[i]=mc[y[i]];
        //数组y保存的是对第二关键字排序的结果 。
        //数组wr保存的是对第二关键字排序后的mc值
        //以下为对第一关键字排序
        for(i=0;i<=m;i++)JS[i]=0;
        for(i=1;i<=n;i++)JS[wr[i]]++;
        for(i=1;i<=m;i++)JS[i]+=JS[i-1];
        for(i=n;i>=1;i--)sa[JS[wr[i]]--]=y[i];
        memcpy(wr,mc,sizeof(wr));   
        p=1;mc[sa[1]]=1;
        for(i=2;i<=n;i++){
            if(!cmp(sa[i],sa[i-1],ln))p++;
            mc[sa[i]]=p;
        }
        //得到新的mc数组
        m=p;ln*=2;
    }
    a[0]=0;sa[0]=0;
}
void get_he(int n){
    int i,j,k=0;
    for(i=1;i<=n;i++){
        j=sa[mc[i]-1];
        if(k)k--;
        while(a[j+k]==a[i+k])k++;
        height[mc[i]]=k;
    }
}
bool check(int n,int k,int kt){
    int num=1;
    for(int i=2;i<=n;i++){
        if(height[i]<k)num=1;
        else num++;
        if(num>=kt)return true;
    }
    return false;
}
void erfen(int n,int kn){
    int l,r,mid,ans;
    l=0;r=n;
    while(l<=r){
        mid=(l+r)/2;
        if(check(n,mid,kn)==true){
            ans=mid;
            l=mid+1;
        }
        else r=mid-1;
    }
    printf("%d\n",ans);
}
int main(){
    int n,kt;
    while(scanf("%d%d",&n,&kt)!=EOF){
        int k;
        for(int i=1;i<=n;i++){
            scanf("%d",&a[i]);
        }
        get_sa(n,110000);
        get_he(n);
        erfen(n,kt);
    }
    return 0;
}