SA板子

SA板子


  • 代码
#include<bits/stdc++.h>
using namespace std;
const int maxn = 1000010;
int n;
char s[maxn];
int sa[maxn],rank[maxn],height[maxn];
int p[maxn],tmp[maxn],cnt[maxn];

bool equal(int x,int y,int l){
    return rank[x] == rank[y] && rank[x + l] == rank[y + l];
}
void doubling(){
    for(int i=1;i<=n;++i){
        rank[i]=s[i];
        sa[i]=i;
    }
    for(int l=0,pos=0,sig=255;pos<n;sig=pos){
        pos=0;
        for(int i=n-l+1;i<=n;++i) p[++pos]=i;
        for(int i=1;i<=n;++i)
            if(sa[i]>l)p[++pos]=sa[i]-l;
        //"p[i]表示第二关键字的后缀标号
        memset(cnt,0,sizeof(int)*(sig+1));
        
        for(int i=1;i<=n;++i) ++cnt[rank[i]];
        for(int i=1;i<=sig;++i) cnt[i]+=cnt[i-1];
        
        for(int i=n;i;--i) sa[cnt[rank[p[i]]]--]=p[i];
        //"更新排名
        pos=0;
        for(int i=1;i<=n;++i) tmp[sa[i]]=equal(sa[i],sa[i-1],l)?pos:++pos;
        for(int i=1;i<=n;++i) rank[i]=tmp[i];
        l=!l?1:l<<1; 
    }
    return;
}

int main(){
    scanf("%s",s+1);
    n=strlen(s+1);
    doubling();
    for(int i=1;i<=n;++i)
        printf("%d ",sa[i]);
    puts("");
    return 0;
}

  • UPD:加入了height和询问rank
#include<bits/stdc++.h>
using namespace std;
const int N=4e5+5;
typedef long long ll;
const int LOG=20;
char ch[N];int n;
ll a[N];
ll height[N];int sa[N],cnt[N],rk[N],tmp[N],p[N];

ll end[N];

ll st[N][20];
void get_height() {
    for (int i = 1, j, k = 0; i <= n; i++, (k) ? (k--) : (0)) {
        if (rk[i]>1) {
            j = sa[rk[i] - 1];
            while (i + k <= n && j + k <= n && ch[i + k] == ch[j + k]) k++;
            height[rk[i]] = (ll)k;
        }
	}
}
void get_ST() {
  for (int i = 1; i <= n; i++) {
    st[i][0] = height[i];
  }
  for (int j = 1; j <= LOG - 1; j++) {
    for (int i = (1 << j); i <= n; i++) {
      st[i][j] = min(st[i][j - 1], st[i - (1 << (j - 1))][j - 1]);
    }
  } 
}
inline void buildSA(){
	for(int i=1;i<=n;i++){
		rk[i]=ch[i],sa[i]=i;
	}
	for(int l=0,sz=255,pos=0;pos<n;sz=pos){
		pos=0;
		for(int i=n-l+1;i<=n;++i) p[++pos]=i;
		for(int i=1;i<=n;i++) if(sa[i]>l) p[++pos]=sa[i]-l;
		memset(cnt,0,sizeof(int)*(sz+1));
		for(int i=1;i<=n;++i) cnt[rk[i]]++;
		for(int i=1;i<=sz;i++) cnt[i]+=cnt[i-1];
		for(int i=n;i;i--) sa[cnt[rk[p[i]]]--]=p[i];
		pos=0;
		for(int i=1;i<=n;i++)tmp[sa[i]]=(rk[sa[i]]==rk[sa[i-1]] && rk[sa[i]+l]==rk[sa[i-1]+l]) ? pos:++pos;
		for(int i=1;i<=n;i++)rk[i]=tmp[i];
		l= !l?1:l<<1;
	}
	get_height();
	get_ST();
	//for(int i=1;i<=n;i++)cout<<height[i]<<" "<<sa[i]<<endl;
	for(int i=n;i;i--){
		end[i]=end[i+1]+(ll)(n-sa[i]+1)-height[i];
		//cout<<end[i]<<" ";
	}
	//end[n]=1;
}


ll getrank(int l, int r) {
  int x = rk[l], len = r - l + 1;
  for (int k = LOG - 1; k >= 0; k--) {
    if (st[x][k] >= len) {
      x -= 1 << k;
    }
  }
  return end[x + 1] + ll(n - sa[x] + 1 - len + 1);
}
  • UPD:子串LCP以及第k大子串(重复不算)
#include<bits/stdc++.h>
using namespace std;
const int N=3e5+5;
char ch[100010];
int n,m,sa[N],p[N],tmp[N],rank[N],cnt[N];
typedef long long ll;
ll height[N],aft[N];
inline void build_height() {
    for(int i=1,j,k=0; i<=n; i++,k=max(0,k-1)) {
        if(rank[i]>1) {
            j=sa[rank[i]-1];
            while(i+k<=n&&j+k<=n&&ch[i+k]==ch[j+k])k++;
            height[rank[i]]=(ll)k;
        }
    }
}
int st[N][20];
int LG[N];
inline void buildST() {
    for(int i=1; i<=n; i++)st[i][0]=height[i];
    for(int i=2; i<=n; i++)LG[i]=LG[i>>1]+1;
    for(int j=1; (1<<j)<=n; j++)
        for(int i=1; i+(1<<j)-1<=n; i++) {
            st[i][j]=min(st[i][j-1],st[i+(1<<(j-1))][j-1]);
        }
}
inline int findlcp(int x,int y) {
    int L=rank[x],R=rank[y];
    if(L>R)swap(L,R);
    if(L==R)return n+100;
    L++;
    int logg=LG[R-L+1];
    return min(st[L][logg],st[R-(1<<logg)+1][logg]);
}
inline void build() {
    for(int i=1; i<=n; i++) {
        sa[i]=i,rank[i]=ch[i];
    }
    for(int l=0,pos=0,sz=255; pos<n; sz=pos,l=!l?1:l<<1) {
        pos=0;
        for(int i=n-l+1; i<=n; i++)p[++pos]=i;
        for(int i=1; i<=n; i++)if(sa[i]>l)p[++pos]=sa[i]-l;
        memset(cnt,0,sizeof(int)*(sz+1));
        for(int i=1; i<=n; i++)++cnt[rank[i]];
        for(int i=1; i<=sz; i++)cnt[i]+=cnt[i-1];
        for(int i=n; i; i--) sa[cnt[rank[p[i]]]--]=p[i];
        pos=0;
        for(int i=1; i<=n; i++)tmp[sa[i]]=(rank[sa[i]]==rank[sa[i-1]]&&rank[sa[i]+l]==rank[sa[i-1]+l])?pos:++pos;
        for(int i=1; i<=n; i++)rank[i]=tmp[i];
    }
    build_height();
    buildST();
    for(int i=n; i; i--)
        aft[i]=aft[i+1]+n-sa[i]+1-height[i];
    for(int i=1; i<n; i++)
        aft[i]=aft[i+1];
    aft[n]=0;
}
typedef pair<int,int> pii;
inline pii findKth(ll R) {
    int l=1,r=n;
    while(l<r) {
        int mid=(l+r)>>1;
        if(aft[mid]>=R) l=mid+1;
        else r=mid;
    }
    R-=aft[l];
    return pii(sa[l],n-R+1);
}

bool cmp(int l1,int r1,int l2,int r2) {
    int lcp=findlcp(l1,l2);
    int len1=r1-l1+1,len2=r2-l2+1;
    if(lcp>=len1&&lcp>=len2) return len1<len2;
    else if(lcp>=len1) return true;
    else if(lcp>=len2) return false;
    else return rank[l1]<rank[l2];
}

int main() {
    scanf("%d",&m);
    scanf("%s",ch+1);
    n=strlen(ch+1);
    build();
}

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值