后缀数组模板

后缀数组真难,QAQ

自己写了一个,找了两份模板

主流两种算法:

倍增法(时间O(NlogN),空间O(N))

DC3算法((  时间复杂度O(N),空间复杂度O(3N) ))

 

倍增(DA)算法1:

const int MAXN = 1e5+5;
int SA[MAXN], rank[MAXN], Height[MAXN];
int tax[MAXN], tp[MAXN], a[MAXN], n, m; //n为字符串长度,m为ascii码最值多一点;
char str[MAXN];
//rank[i] 第i个后缀的排名; SA[i] 排名为i的后缀位置; Height[i] 排名为i的后缀与排名为(i-1)的后缀的LCP(最长公共前缀)
//tax[i] 计数排序辅助数组; tp[i] rank的辅助数组(计数排序中的第二关键字),与SA意义一样。
//a为原串

void init(){
    n = strlen(str);
    m = 130;   //一开始是以单个字符为单位,所以(m = 130)
    for(int i=0;i<n;i++)
        a[i+1] = str[i];
    for(int i=1;i<=n;i++)
        rank[i] = a[i],tp[i] = i;
}

void Rsort(){
    //基数排序,rank是第一关键字,tp第二关键字
    for(int i=0;i<=m;i++) tax[i] = 0;
    for(int i=1;i<=n;i++) tax[rank[tp[i]]]++;
    for(int i=1;i<=m;i++) tax[i] += tax[i-1];
    for(int i=n;i>=1;i--) SA[tax[rank[tp[i]]]--] = tp[i];
}

int cmp(int *f, int x, int y, int w) { return f[x] == f[y] && f[x + w] == f[y + w]; }
//通过二元组两个下标的比较,确定两个子串是否相同

void calheight(){
    int j, k = 0;
    for(int i = 1; i <= n; Height[rank[i ++]] = k)
        for( k = k ? k - 1 : k, j = SA[rank[i] - 1]; a[i + k] == a[j + k]; ++ k);
}

void DA(){
    init();
    Rsort();
    for(int j=1,p=1,i;p<n;j*=2,m=p){  //把子串长度翻倍,更新rank
        //j当前一个子串的长度; m 当前离散后的排名种类数
        //当前的tp(第二关键字)可直接由上一次的SA的得到
        for(p=0,i=n-j+1;i<=n;i++) tp[++p] = i;
        for(i=1;i<=n;i++) if(SA[i]>j) tp[++p] = SA[i]-j; //长度越界,第二关键字为0
        //更新SA值,并用tp暂时存下上一轮的rank(用于cmp比较)
        Rsort();
        swap(rank,tp);
        rank[SA[1]]= p = 1;
        for(i=2;i<=n;i++)
            rank[SA[i]] = cmp(tp,SA[i],SA[i-1],j)?p:++p;
    }
    calheight();
}

倍增(DA)算法2:

/* str[]为当前长度为len的字符串,数组下标从1开始
   suffix[i]表示从字符串中的下标为i的字符到最后一个字符形成的子串。
   比如abcdab   suffix[3]=cdab;
               suffix[4]=dab;
   Rank数组储存后缀按照字典序从小到大的排名。
   Rank[i]表示suffix[i]的后缀排名
   比如bbbba   Rank[5]=1;表示从第五个字符开始的后缀排名第一(最小)
   sa[i]表示排名为i的后缀的下标(排名为i的后缀的首字母),和RANK数组为逆运算(sa已知排名求位置,RANK知道位置求排名)
   比如bbbba   sa[1]=5;

   height[i]表示 排名为i的后缀和排名为i-1的后缀的最长公共前缀的长度
   比如aaaaa  排名为3的后缀为aaa,排名为2的后缀为aa
   所以height[3]=2;*/

#include <cstdio>
#include <iostream>
#include <algorithm>
#include <cstring>
typedef long long ll;
using namespace std;
const int MAXN=200010;
int wa[MAXN],wb[MAXN],wv[MAXN],Ws[MAXN];
char str[MAXN];
int cmp(int *r,int a,int b,int l)
{return r[a]==r[b]&&r[a+l]==r[b+l];}
void da(const char r[],int sa[],int n,int m)  //n为len+1,m一般比数组中最大的数大一点即可 
{
      int i,j,p,*x=wa,*y=wb,*t;
      for(i=0; i<m; i++) Ws[i]=0;
      for(i=0; i<n; i++) Ws[x[i]=r[i]]++;
      for(i=1; i<m; i++) Ws[i]+=Ws[i-1];
      for(i=n-1; i>=0; i--) sa[--Ws[x[i]]]=i;
      for(j=1,p=1; p<n; j*=2,m=p)
      {
            for(p=0,i=n-j; i<n; i++) y[p++]=i;
            for(i=0; i<n; i++) if(sa[i]>=j) y[p++]=sa[i]-j;
            for(i=0; i<n; i++) wv[i]=x[y[i]];
            for(i=0; i<m; i++) Ws[i]=0;
            for(i=0; i<n; i++) Ws[wv[i]]++;
            for(i=1; i<m; i++) Ws[i]+=Ws[i-1];
            for(i=n-1; i>=0; i--) sa[--Ws[wv[i]]]=y[i];
            for(t=x,x=y,y=t,p=1,x[sa[0]]=0,i=1; i<n; i++)
                  x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++;
      }
      return;
}
int sa[MAXN],Rank[MAXN],height[MAXN];// sa是通过后缀排名找到它在字符串中的位置,rank是根据位置找到后缀排名,两者相逆,该模板中sa数组的最小值为1。

void calheight(const char *r,int *sa,int n)
{
      int i,j,k=0;
      for(i=1; i<=n; i++) Rank[sa[i]]=i;
      for(i=0; i<n; height[Rank[i++]]=k)
            for(k?k--:0,j=sa[Rank[i]-1]; r[i+k]==r[j+k]; k++);
    //  for(int i=n;i>=1;--i) ++sa[i],Rank[i]=Rank[i-1];
}
int main()
{
  int t,len;
  scanf("%d",&t);
  while(t--)
  {
      scanf("%s",str);
      len=strlen(str);
      da(str,sa,len+1,130);
      calheight(str,sa,len);
      ll ans=(long long)len*(len+1)/2;
      for(int i=2;i<=len;i++)
      {
        ans-=height[i];
      }
      printf("%lld\n",ans);
  }
return 0;
}

DC3算法:

#include<cstdio>
#include<cstring>
#include<algorithm>
#include<iostream>
#define maxn 1000003
#define F(x) ((x)/3+((x)%3==1?0:tb))
#define G(x) ((x)<tb?(x)*3+1:((x)-tb)*3+2)
using namespace std;
int wa[maxn],wb[maxn],wv[maxn],WS[maxn];
int r[maxn],sa[maxn];
int c0(int *r,int a,int b)
{return r[a]==r[b]&&r[a+1]==r[b+1]&&r[a+2]==r[b+2];}
int c12(int k,int *r,int a,int b)
{if(k==2) return r[a]<r[b]||r[a]==r[b]&&c12(1,r,a+1,b+1);
    else return r[a]<r[b]||r[a]==r[b]&&wv[a+1]<wv[b+1];}
void sort(int *r,int *a,int *b,int n,int m)
{
    int i;
    for(i=0;i<n;i++) wv[i]=r[a[i]];
    for(i=0;i<m;i++) WS[i]=0;
    for(i=0;i<n;i++) WS[wv[i]]++;
    for(i=1;i<m;i++) WS[i]+=WS[i-1];
    for(i=n-1;i>=0;i--) b[--WS[wv[i]]]=a[i];
    return;
}
void dc3(int *r,int *sa,int n,int m)
{
    int i,j,*rn=r+n,*san=sa+n,ta=0,tb=(n+1)/3,tbc=0,p;
    r[n]=r[n+1]=0;
    for(i=0;i<n;i++) if(i%3!=0) wa[tbc++]=i;
    sort(r+2,wa,wb,tbc,m);
    sort(r+1,wb,wa,tbc,m);
    sort(r,wa,wb,tbc,m);
    for(p=1,rn[F(wb[0])]=0,i=1;i<tbc;i++)
        rn[F(wb[i])]=c0(r,wb[i-1],wb[i])?p-1:p++;
    if(p<tbc) dc3(rn,san,tbc,p);
    else for(i=0;i<tbc;i++) san[rn[i]]=i;
    for(i=0;i<tbc;i++) if(san[i]<tb) wb[ta++]=san[i]*3;
    if(n%3==1) wb[ta++]=n-1;
    sort(r,wb,wa,ta,m);
    for(i=0;i<tbc;i++) wv[wb[i]=G(san[i])]=i;
    for(i=0,j=0,p=0;i<ta && j<tbc;p++)
        sa[p]=c12(wb[j]%3,r,wa[i],wb[j])?wa[i++]:wb[j++];
    for(;i<ta;p++) sa[p]=wa[i++];
    for(;j<tbc;p++) sa[p]=wb[j++];
    return;
}
int RANK[maxn],height[maxn];
void calheight(int *r,int *sa,int n)
{
    int i,j,k=0;
    for(i=1;i<=n;i++) RANK[sa[i]]=i;
    for(i=0;i<n;height[RANK[i++]]=k)
        for(k?k--:0,j=sa[RANK[i]-1];r[i+k]==r[j+k];k++);
    return;
}
int RMQ[maxn];
int mm[maxn];
int best[20][maxn];
void initRMQ(int n)
{
    int i,j,a,b;
    for(mm[0]=-1,i=1;i<=n;i++)
        mm[i]=((i&(i-1))==0)?mm[i-1]+1:mm[i-1];
    for(i=1;i<=n;i++) best[0][i]=i;
    for(i=1;i<=mm[n];i++)
        for(j=1;j<=n+1-(1<<i);j++)
        {
            a=best[i-1][j];
            b=best[i-1][j+(1<<(i-1))];
            if(RMQ[a]<RMQ[b]) best[i][j]=a;
            else best[i][j]=b;
        }
    return;
}
int askRMQ(int a,int b)
{
    int t;
    t=mm[b-a+1];b-=(1<<t)-1;
    a=best[t][a];b=best[t][b];
    return RMQ[a]<RMQ[b]?a:b;
}
int lcp(int a,int b)
{
    int t;
    a=RANK[a];b=RANK[b];
    if(a>b) {t=a;a=b;b=t;}
    return(height[askRMQ(a+1,b)]);
}
char c[maxn];
struct pi{
    int x;
    int y;
}pp[maxn];
int main()
{
    int i,j,len,m,p,k,le,ri,mid,minn;
        while(scanf("%s",c)!=EOF){
            if(c[0]=='.')
            break;
        len=strlen(c);
        minn=len;
        for(i=0;i<len;i++){
            r[i]=c[i]-'0';//注意需要是'0'
        }
        r[len]=0;
        dc3(r,sa,len+1,200002);
        calheight(r, sa, len);

          for(int i=2;i<=len;i++)
      {
       //   cout<<sa[i]<<" "<<sa[i-1]<<" "<<height[i]<<endl;
         if(sa[i]==0&&sa[i-1]-sa[i]==len-height[i])
          if(len%(len-height[i])==0)
          minn=min(minn,len-height[i]);
         else if(sa[i-1]==0&&sa[i]-sa[i-1]==len-height[i])
          if(len%(len-height[i])==0)
          minn=min(minn,len-height[i]);
      }
      printf("%d\n",len/minn);
    }
}

 

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值