后缀数组模板(详细理解)

原创 2016年08月29日 20:14:12

后缀数组

后缀数组看了很久了,从基数排序开始看一只看到height数组的实现也理解了很多东西,不过别人的东西再多也不是自己的,因此自己重新总结了一下,顺便学一个后缀数组的模板备用,这里以SPOJ 694为例。

#include <ctime>
#include <cstdio>
#include <cstring>
#include <iostream>
#include <algorithm>
using namespace std;
const int maxn = 1e5+5;

char s[maxn];
int sa[maxn],t[maxn],t2[maxn],c[maxn];
int rank[maxn],height[maxn];

void build_sa(int n,int m){
    int i,*x = t, *y = t2;  //引用指针只是为了后面好交换
    for(i = 0; i < m; i++) c[i] = 0;
    for(i = 0; i < n; i++) c[x[i] = s[i]]++;
    for(i = 1; i < m; i++) c[i] += c[i-1];
    for(i = n-1; i >= 0; i--) sa[--c[x[i]]] = i;  //sa[i]中表示排名第i的位置是多少
    for(int k = 1; k <= n; k <<= 1){ //k表示每次基数排序需要比较的长度,因为是按照倍增算法所以每次比较2个关键字
        int p = 0;
        //直接利用sa数组排序第二关键字
        for(i = n-k; i < n; i++) y[p++] = i; //y中存放按第二关键字从小到大排序的位置
        for(i = 0; i < n; i++) if(sa[i] >= k) y[p++] = sa[i]-k;
        //基数排序第一关键字
        for(i = 0; i < m; i++) c[i] = 0;
        for(i = 0; i < n; i++) c[x[y[i]]]++;
        for(i = 0; i < m; i++) c[i] += c[i-1];
        for(i = n-1; i >= 0; i--) sa[--c[x[y[i]]]] = y[i];   //i从大到小是为了保证相同字符的情况下默认靠前的更小一些
        swap(x, y);  //这里只用交换指针即可
        p = 1; x[sa[0]] = 0; //p表示rank值不同的字符串的数量,如果达到n表示字符串的所有关系都找出来了
        for(i = 1; i < n; i++)  //重新计算x的值
            x[sa[i]] = y[sa[i-1]] == y[sa[i]] && y[sa[i-1]+k] == y[sa[i]+k]?p-1:p++;
        if(p >= n) break;
        m = p;
    }
}

void getHeight(int n){
    int i,j,k = 0;
    for(i = 0; i < n; i++) rank[sa[i]] = i; //求出rank值,利用rank和sa是相反的
    for(i = 0; i < n; i++){
        if(k) k--; //利用h[i] >= h[i-1]+1这个性质,先求出前面的后面的就可以由前面推出
        j = sa[rank[i]-1];
        while(s[i+k] == s[j+k]) k++;
        height[rank[i]] = k;
    }
}

int main(){
    #ifdef LOCAL
        freopen("input.txt", "r", stdin);
        freopen("output.txt", "w", stdout);
        int _time_jc = clock();
    #endif // LOCAL
    int T;
    scanf("%d", &T);
    while(T--){
        scanf("%s", s);
        int len = strlen(s);
        build_sa(len+1, 130);  //为了添加一个由字符串结束符为后缀的字符串
        getHeight(len+1);
//      printf("%d\n", sa[0]);
        int ans = 0;
        for(int i = 1; i <= len; i++)
            ans += (len-sa[i]-height[i]);
        printf("%d\n", ans);
    }
    #ifdef LOCAL
        printf("time: %d\n", int(clock() - _time_jc));
    #endif // LOCAL
    return 0;
}
版权声明:本文为博主原创文章,未经博主允许不得转载。

后缀数组模板(理解)

字符串的处理真可谓是博大精深,后缀数组这种数据结构我花了两天时间才明白了其构造的过程。主要是代码不好理解。 数据结构: 1.sa数组,就是后缀数组,按照字典序排列,其意义为:sa[i]=k,排第i...

[BZOJ1031]-[JSOI2007]字符加密Cipher-后缀数组模板(附自己的理解)

说在前面之前写后缀数组都是在背板子,而且已经很久没碰过这玩意了….忘得一干二净w 原计划今天下午开始回血,没料到AC自动机的好题实在是太多了,不得不去写一遍,回血计划被迫推迟到了晚上=A= 不得不...

后缀数组PPT详细解答

  • 2009年07月25日 00:18
  • 419KB
  • 下载

详细解析后缀数组(RMQ及LCP)

  • 2013年06月11日 10:18
  • 787KB
  • 下载

SA后缀数组模板 文件修复

后缀数组记数排序SA rank height ssort() { memset(a,0,sizeof(a)); int mx=0;fo(i,1,n) a[x[y[i]]]++,mx=m...

后缀数组-Java版:带详细注释

  • 2011年10月04日 13:48
  • 9KB
  • 下载

后缀数组dc3模板(范围1e6而且多样例要用dc3)

#include #include #include #include #include #include #define F(x) ((x)/3+((x)%3==1?0:tb)) #define G...

【tyvj 1860】 后缀数组模板

后缀数组
  • DERITt
  • DERITt
  • 2016年03月08日 21:26
  • 433

【Plan 第六场】【后缀数组模板】

题目见2015-1 1.6 A 后缀数组乱搞,蒟蒻看到uoj有人DA胜过DC3,于是又换了个版。。。 #include #include #include #include ...

后缀数组模板详解。

给定一个字符串S,比如它是(abcad),那么它的后缀有”abcad“  ,"bcad ", "cad",  "ad", "d", ""。 讲这些后缀字符串按照字典序排序,得到的就是后缀数组。如果用普...
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:后缀数组模板(详细理解)
举报原因:
原因补充:

(最多只允许输入30个字)