P3809 后缀排序(倍增法后缀数组)

问题

分析

  • 基数排序
  • 第2关键字排序后,再对第1关键字分桶
  • 然后再按第2关键字的(逆)序遍历,即可将第1关键字的同一桶内元素排序

代码

/* P3809 后缀排序 */
// 排名(rank):无并列,例如:0、1、2、3、4、5、…… 
// 排序:有并列, 例如:0、0、1、2、2,……
#include<bits/stdc++.h>
using namespace std;
const int MXN = 1e6+10;
char s[MXN];    // 字符串
int n;          // 字符串长度
int fir[MXN];   // 第1关键字排序, 下标 -> 排序;fir[i]:下标为i的后缀的排序为fir[i]
int sec[MXN];   // 第2关键字排名, 排名 -> 下标;sec[i]:排名为i的后缀的下标为sec[i]
int c[MXN];     // 对第1关键字的排序计数
int sa[MXN];    // 是当前第1和第2关键字的总排名,也是下一次的第1关键字序, 排名 -> 下标
void calc_sa(){
    int *x = fir, *y = sec, m = 256;
    // for(int i = 0; i < n; ++i) x[i] = s[i] /* - 'a' */; // x: 第1关键字排序
    for(int i = 0; i < m; ++i) c[i] = 0;
    for(int i = 0; i < n; ++i) ++c[x[i] = s[i]]; // 第1关键字排序计数
    for(int i = 1; i < m; ++i) c[i] += c[i-1];
    for(int i = n-1; i >= 0; --i) sa[--c[x[i]]] = i; // 下标从0开始
    for(int p, k = 1; k <= n; k <<= 1){
        /* 构建长度2k时的第2关键字排名 */
        p = 0; // 第2关键字的排名
        for(int i = n-k; i < n; ++i) y[p++] = i; // 无第2关键字,排名最小
        // 按序i遍历, sa[i](位置)在[0, k-1]内的不能成为第2关键字;否则是位置sa[i]-k的第2关键字序
        for(int i = 0; i < n; ++i) if(sa[i] >= k) y[p++] = sa[i] - k; // 转换:i -> p
        
        /* 长度k的排名结果sa是长度2k时的第1关键字排名 */
        for(int i = 0; i < m; ++i) c[i] = 0;
        for(int i = 0; i < n; ++i) ++c[x[i]];        // 对第1关键字排序计数
        // for(int i = 0; i < n; ++i) ++c[x[sa[i]]]; // 对第1关键字排序计数
        // for(int i = 0; i < n; ++i) ++c[x[y[i]]];  // 对第1关键字排序计数(参考资料基本此法)
        for(int i = 0; i < m; ++i) c[i] += c[i-1];
        for(int i = n-1; i >= 0; --i) sa[--c[x[y[i]]]] = y[i];// 按第2关键字的序遍历,得到第1、2关键字的排名

        // 获取本次结果的排序,它是下一次的第1关键字排序,为下一轮做准备
        swap(x, y); // 交换:第1关键字的排序 和 第2关键字的排名;
        p = 1, x[sa[0]] = 0;
        for(int i = 1; i < n; ++i)  // 第1、2关键字排序相同,则排序并列;越界时,第1关键字必不等
            x[sa[i]] = (y[sa[i-1]] == y[sa[i]] && y[sa[i-1]+k] == y[sa[i]+k])?p-1:p++;
       
        if(p >= n) break; // 所有后缀长度不一,排名必然不一,即p必可以到n
        m = p;
    }
}
int main(){
    scanf("%s", s);
    n = strlen(s) + 1; // 包括串结束符,结束符构成的后缀排序必最小,且无并列
    calc_sa();
    for(int i = 1; i < n-1; ++i) printf("%d ", sa[i]+1);
    printf("%d\n", sa[n-1]+1);
    // for(int i = 1; i < n; ++i) printf("%s\n", s+sa[i]); // 有效的后缀排名从1开始
    return 0;
}
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

jpphy0

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值