文章首次提出了构造后缀数组的概念。并给出了时间复杂度为O(nlogn)的后缀数组构造算法。算法的思想具体如下:
排序分为log2(N+1)step,在第一步,字符串的所有后缀按照其第一个字符相同与否放入不同或相同的桶中。然后递归地,每一步都都按照上一步两倍的前缀字符来对后缀字符串进行划分并将其放入相应的桶中。即,每一步比较的前缀字符的个数分别是:1,2,4,8...。在第H步,后缀是按照<=H-Order来进行排序的。在H段后所有后缀被分入到了mH个桶中,每一个桶中存放的后缀们的前H个字符是相同的。这些桶是按照<=H-order排序的。那么我们如何在O(N)时间内根据这H-bucket排好的后缀来产生<=2H-order的排序。
在网上看到的一个ppt里面对于S= assassin的字符串的所有后缀进行1-bucket排序:这里我不明白的是为什么assin在assassin的前面。同样最后一个桶中的四个字符串为什么是这样的排序?