后缀数组倍增法模板

后缀数组倍增法模板

#include <bits/stdc++.h>
using namespace std; 
int n,k,ranks[100003],sa[12]; //SA数组的含义:SA[I]表示所有后缀中排第I位的起始位是SA[i]
bool compare_sa(int i,int j){ //比较起始位置为i与j的后缀先后
    if(ranks[i]!=ranks[j])return ranks[i]<ranks[j]; //rank不同返回小的
    else{//如果相同,就要比较加上K位后的那个字符的rank
        int ri=i+k<=n?ranks[i+k]:-1;//如果到串尾就置-1
        int rj=j+k<=n?ranks[j+k]:-1;//如果到串尾就置-1
        return ri<rj;
    }//ranks[i]更新完之后表示第i位开始的后缀在所有后缀中的排名
}ranks[i]在更新过程中表示第i位开始的长为K的子串在所有长为K的子串中的排名(当然到串末的子串可能不够K长,那指的就是后缀了
void construct_sa(string s,int *sa){//对串S构造后缀数组SA:初始化,循环更新sa与rank
    n=s.length();                   //读出其长度
    for(int i=0;i<=n;i++){          //初始化sa与ranks数组
        sa[i]=i;                    //把起始位置下标塞进去(乱塞,反正后面排序)
        ranks[i]=i<n?s[i]:-1;       //rank初始化为其起始字符,空串s[n]优先级-1最高
    }
    for(k=1;k<=n;k*=2){             //倍增K至大于N即最长后缀排好则结束
        sort(sa,sa+n+1,compare_sa); //更新sa,用rank对SA排序,每次以2k长度排序
        ranks[sa[0]]=0;             //后缀中空串必为第0位,sa[0]必定n,输出可见全为11
        for(int i=1;i<=n;i++)ranks[sa[i]]=ranks[sa[i-1]]+(compare_sa(sa[i-1],sa[i])?1:0);
        //上一后缀小于当前后缀时排名加1,等于则不加,因上面sort故前面不比后面大
        //每一次的rank都是重新计算的,而sa就是不断对各位起始位对应后缀进行排序
    }
}
bool compare(string s,int *sa,string t){//寻找S中是否出现t对
    int a=0,b=s.length();
    while(b-a>1){ 		//二分后缀起始位,
        int c=(a+b)/2;	//下面compare是STL中STRING封装函数,文末说明
        if(s.compare(sa[c],t.length(),t)<0)a=c; //<0则S比T小,故答案排名靠后,左界右移
        else b=c;		//否则右界左移,这里包含了相等的情况,在最后再判是否等于0
    }
    return s.compare(sa[b],t.length(),t)==0;
}
int main(){
    string s="abracadabra";construct_sa(s,sa);
    for(int i=0;i<12;i++)cout<<sa[i]<<' ';cout<<endl;
    string t="abr"; cout<<compare(s,sa,t)<<endl;
    return 0;
}

#include <iostream>
#include <string>
using namespace std;
int main(){
    string a("aBcdef");string b("AbcdEf");string c("123456");string d("123dfg");
    //下面是各种比较方法,前面减去后面的ASCII码,>0返回1,<0返回-1,相同返回0
    int m=a.compare(b); //完整比较a和b
    int n=a.compare(1,5,b); //“Bcdef”和“AbcdEf”的比较,比较a和b的从1到5位
    int p=a.compare(1,5,b,4,2); //“Bcdef”和“Ef”的比较
    int q=c.compare(0,3,d,0,3); //"123"和“123”的比较
    cout<<"m="<<m<<",n="<<n<<",p="<<p<<",q="<<q<<endl;
    return 0;
}
输出:m=1,n=1,p=-1,q=0
补充:height数组与h数组
int height[maxn],h[maxn];//height[i]:从SA[i]位开始的后缀与上一排名后缀的LCP,h[i]见下文
int ranks[maxn];	//ranks[i]:第I位开始的后缀的排名
//ranks与SA数组是对应关系,SA[I]是排第I位的后缀的开始位置
void calheight(int *r,int *sa,int n){//传入串r,求它的height数组,已知其rank与sa数组
    int i,j,k=0;//下面由1~N是因为空串在所有后缀中排名必为第0位,sa[0]必定n即开始位置是第N位,ranks[n]本身就等于0所以不记录
    for(i=1;i<=n;i++) ranks[sa[i]]=i;//初始化RANKS,排名第I后缀开始位置对应的后缀排名是i
for(i=0;i<n;height[ranks[i++]]=k)//i是r串字符开始位置
//每轮结束更新排名第ranks[i]位的后缀与排名第ranks[i]-1的后缀的LCP为K
      for(k?k--:0,j=sa[ranks[i]-1] ; r[i+k]==r[j+k] ; k++);       
    //一开始K是零不操作,然后排名第ranks[i]-1位的开始位置记为J,第一轮r[i+k]==r[j+k]
//判 R数组i+k位与j+k位是否相同,同K就增加,不同就退出,K就是最大长度
for(i=1;i<=n;i++)h[i] = height[ranks[i]];//h[i]是排名为i的后缀与排名i-1的后缀的LCP
    return;
}
设suffix(k)是排在suffix(i-1)前一名的后缀,它们的最长公共前缀是h[i-1]。
则suffix(k+1)将排在suffix(i)的前面,并且suffix(k+1)和suffix(i)的最长公共前缀是h[i-1]-1,
故suffix(i)和在它前一名的后缀的最长公共前缀至少是h[i-1]-1
但suffix(k+1)开始的后缀的排名并不一定说是suffix(i)开始的后缀的排名上一位!
举例设从i-1位开始的后缀的排名为q,从第k位开始的后缀的排名为q-1,LCP=h[i-1]
rank[k] = q-1   suffix(k):      rabaa
rank[i-1] = q   suffix(i-1):    racadabrabaa   h[i-1] = 2;
显然从i-1位开始的后缀与从第k位开始的后缀,LCP=h[i-1]-1
显然x<y,但并不一定是相差一,可能排名为y-1的后缀串以acaa开头的!
rank[k+1] = x    suffix(k+1):    abaa
rank[i] = y      suffix(i):      acadabrabaa    h[i] >= h[i-1]-1 = 1;
虽然从第k位开始的后缀排名不一定是从i-1位开始的后缀的排名的前一位,但是因为两者有LCP=h[i-1]-1,所以从i-1位开始的后缀的排名的前一位的后缀至少也有该LCP长度的前缀是相同的

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值