后缀数组--倍增法注解

原文地址:http://caiminjian.diandian.com/post/2012-08-27/40038043416

模板及注释
int wa[maxn],wb[maxn],wv[maxn],ws[maxn];

int rank[maxn],height[maxn],sa[maxn];

bool cmp(int *r,int a,int b,int l)

{

   return r[a]==r[b]&&r[a+l]==r[b+l];

}

//da函数的参数m代表字符串中字符的取值范围,是基数排序的一个参数,如果原序列都是字母可以直接取128,如果原序列本身都是整数的话,则m可以取比最大的整数大1的值。

void da(int *r,int *sa,int n,int m)

{

   int i,j,p,*x=wa,*y=wb,*t;

   //对长度为1的字符串排序

   for(i=0;i<m;i++) ws[i]=0;

   for(i=0;i<n;i++) ws[x[i]=r[i]]++;//统计字符的个数

   for(i=1;i<m;i++) ws[i]+=ws[i-1];//统计不大于字符的字符个数

   for(i=n-1;i>=0;i--) sa[--ws[x[i]]]=i;//计算字符排名

 

   //基数排序

   for(j=1,p=1;p<n;j*=2,m=p)

   {

       //第二关键字排序

       for(p=0,i=n-j;i<n;i++) y[p++]=i;//第二关键字为0的排在前面

       for(i=0;i<n;i++) if(sa[i]>=j) y[p++]=sa[i]-j;//长度为j的子串sa[i]应该是长度为2*j的子串sa[i]-j的后缀(第二关键字),对所有的长度为2*j的子串根据第二关键字来排序

       for(i=0;i<n;i++) wv[i]=x[y[i]]; //提取第一关键字

       //按第一关键字排序 (原理同对长度为1的字符串排序)

       for(i=0;i<m;i++) ws[i]=0;

       for(i=0;i<n;i++) ws[wv[i]]++;

       for(i=1;i<m;i++) ws[i]+=ws[i-1];

       for(i=n-1;i>=0;i--) sa[--ws[wv[i]]]=y[i];//按第一关键字排序,计算出了长度为2*j的子串排名情况


        //此时数组x是长度为j的子串的排名情况,数组y仍是根据第二关键字排序后的结果

       //计算长度为2*j的子串的排名情况,保存到数组x
       for(t=x,x=y,y=t,p=1,x[sa[0]]=0,i=1;i<n;i++)

       x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++;//若长度为2*j的子串sa[i]与sa[i-1]完全相同,则他们有相同的排名

   }

}

void calheight(int *r,int *sa,int n)

{

   int i,j,k=0;

   for(i=1;i<=n;i++) rank[sa[i]]=i;

   for(i=0;i<n;height[rank[i++]]=k)

   for(k?k--:0,j=sa[rank[i]-1];r[i+k]==r[j+k];k++);

}


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值