《算法竞赛进阶指南》 后缀数组

后缀数组

后缀数组 (SA) 是一种重要的数据结构,通常使用倍增或者DC3算法实现,这超出了我们的讨论范围。

在本题中,我们希望使用快排、Hash与二分实现一个简单的O(nlog2n)的后缀数组求法。

详细地说,给定一个长度为 n 的字符串S(下标 0~n-1),我们可以用整数 k(0≤k<n) 表示字符串S的后缀 S(k~n-1)。

把字符串S的所有后缀按照字典序排列,排名为 i 的后缀记为 SA[i]。

额外地,我们考虑排名为 i 的后缀与排名为 i-1 的后缀,把二者的最长公共前缀的长度记为 Height[i]。

我们的任务就是求出SA与Height这两个数组。

输入格式
输入一个字符串,其长度不超过30万。

字符串由小写字母构成。

输出格式
第一行为数组SA,相邻两个整数用1个空格隔开。

第二行为数组Height,相邻两个整数用1个空格隔开,我们规定Height[1]=0。

输入样例:
ponoiiipoi
输出样例:
9 4 5 6 2 8 3 1 7 0
0 1 2 1 0 0 2 1 0 2

典型的哈希算法只是计算后缀的哈希,另外在利用哈希计算相同的字符串长度

#include <iostream>
#include <algorithm>
#include <string.h>
#include <limits.h>
using namespace std;
typedef unsigned long long ULL;
const int N=300010,base=131;
int h[N],p[N];
int n;
char str[N];
int sa[N];
ULL get(int l,int r)
{
	return h[r]-h[l-1]*p[r-l+1];
}
int get_max_common_prefix(int a,int b)
{//获得分别从a、b位置开始的最大公共长度
	int l=0,r=max(n-a,n-b);//最大的长度不超过其中长的哪一个
	while(l<r)
	{
		int mid=l+r+1>>1;
		if(get(a,a+mid-1)!=get(b,b+mid-1))r=mid-1;//mid表示从该位置开始两者开始不相同 
		else l=mid;
	}
        return l;
}
bool cmp(int a,int b)
{
	int l=get_max_common_prefix(a,b);
    int av=a+l>n?INT_MIN:str[a+l];//当a的遍历位置超过界限时说明b开始的字典序大
    int bv=b+l>n?INT_MIN:str[b+l];
    return av<bv;
    //加入a、b遍历都没有超过界限的话
    //av、bv时第一个他们的后缀开始不相同的字符。
}
int main()
{
	ios::sync_with_stdio(false);
	cin>>(str+1);
	n=strlen(str+1);
	p[0]=1;
	for(int i=1;i<=n;i++)
	{//进行哈希值运算
		h[i]=h[i-1]*base+str[i]-'a'+1;
		p[i]=p[i-1]*base;
		sa[i]=i;
	}
	sort(sa+1,sa+1+n,cmp);//将源后缀子串按字典序排序
    for(int i=1;i<=n;i++)
    	cout<<sa[i]-1<<' ';
    cout<<endl;//输出后缀的字典序排序
    for(int i=1;i<=n;i++)
        if(i==0)cout<<0<<' ';
    else cout<<get_max_common_prefix(sa[i-1],sa[i])<<' ';
    cout<<endl;
    return 0;

}
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值