倍增算法实现后缀数组详解+实现代码

在绘制上图时，我们需要把所有后缀按字典序从小到大排序，也就是说，我们需要把每个结点的所有子结点排好序，字典序小的在左边(规定$比所有其他字符都小)，然后每个叶结点里标上该后缀首字符的下标。比如后缀NA开始于BANANA的下标4(注意下标从0开始)，那么NA对应的叶结点标有"4"。为了方便描述，我们把“以下标k开头的后缀”表示为Suffix(k)，也就是说，对于文本串BANANA，Suffix(4)就是NA。

现在只需自左向右把所有叶子的编号排列出来，就可以得到后缀数组(suffix array)。

比如，BANANA的后缀数组SA[]={5,3,1,0,4,2}。

名次数组Rank[i]：保存的是Suffix(i)在所有后缀中从小到大排列的“名次”。

简单的说，后缀数组是“排第几的是谁？”，名次数组是“你排第几？”。容易看出，后缀数组和名次数组为互逆运算。

【后缀数组的实现】

根据定义，后缀数组可以直接通过一次快速排序得到，但是在最坏情况下，直接排序需要的时间是O(n^2logn)(虽然比较次数是O(nlogn)，但是两个字符串的比较是O(n)的)。下面介绍后缀数组的~~两种实现方法：~~倍增算法和DC3算法。

【倍增算法】

主要思想：用倍增的方法对每个字符开始的长度为 2^k 的子字符串进行排序，求出排名，即rank值。k从0开始，每次加1，当 2^k 大于n以后，每个字符开始的长度为 2^k 的子字符串便相当于所有的后缀。并且这些子字符串都一定已经比较出大小，即rank值中没有相同的值，那么此时的rank值就是最后的结果。每一次排序都利用上次长度为 $2^{k-1}$ 的字符串的rank值，那么长度为 $2^{k}$ 的字符串就可以用两个长度为 $2^{k-1}$ 的字符串的排名作为关键字表示，然后进行基数排序，便得到了长度为 $2^{k}$ 的字符串的rank值。以字符串“aabaaaab”为例，整个过程如下图所示。x、y表示长度为 $2^{k}$ 的字符串的两个关键字。

【具体实现】

int wa[maxn],wb[maxn],wv[maxn],ws[maxn];
int cmp(int *r,int a,int b,int l)
{return r[a]==r[b]&&r[a+l]==r[b+l];}
void da(int *r,int *sa,int n,int m) //n为字符串的长度加1，因为在使用倍增算法前在原字符串后面加一个0
{
    int i,j,p,*x=wa,*y=wb,*t;
    for(i=0;i<m;i++) ws[i]=0;
    for(i=0;i<n;i++) ws[x[i