后缀数组

原创 2013年12月03日 22:05:01

首先理解基数排序,该排序的优点是1、很快(和桶排一样适用于值域范围较小的情况)2、稳定排序,可以轻松地多关键字排序(只需要先按照次要关键字排序,在按照主要关键字排序)


sa数组存排第i的是谁。

rank数组存i排第几。

ws累计的作用是给位次较小的元素留够空间。


第一步排长度为2^0长度的区间。(初始化)

之后每次利用上次排序的结果作为次要关键字(即已经排好了次要关键字)。来对“排好序”的第一关键字排序。

直到字串变成一个完整的后缀。


第一关键字:b-->

第二关键字:b--a-->(等价于原来的a-->,即给他的起始位置挪一下,就从第一关键字变成了第二关键字)


最后一步删掉重复的后缀。


Height的计算:

位置相邻的两个后缀(不是名词相邻)重复数至少差1,靠前的重复数较多。

int wa[maxn],wb[maxn],wv[maxn],ws[maxn];
int cmp(int *r,int a,int b,int l)
{return r[a]==r[b]&&r[a+l]==r[b+l];}
void da(int *r,int *sa,int n,int m)
{
	int i,j,p,*x=wa,*y=wb,*t;
	for(i=0;i<m;i++) ws[i]=0;
	for(i=0;i<n;i++) ws[x[i]=r[i]]++;
	for(i=1;i<m;i++) ws[i]+=ws[i-1];
	for(i=n-1;i>=0;i--) sa[--ws[x[i]]]=i;
	for(j=1,p=1;p<n;j*=2,m=p)
	{
		for(p=0,i=n-j;i<n;i++) y[p++]=i;
		for(i=0;i<n;i++) if(sa[i]>=j) y[p++]=sa[i]-j;
		for(i=0;i<n;i++) wv[i]=x[y[i]];
		for(i=0;i<m;i++) ws[i]=0;
		for(i=0;i<n;i++) ws[wv[i]]++;
		for(i=1;i<m;i++) ws[i]+=ws[i-1];
		for(i=n-1;i>=0;i--) sa[--ws[wv[i]]]=y[i];
		for(t=x,x=y,y=t,p=1,x[sa[0]]=0,i=1;i<n;i++)
			x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++;
	}
	return;
}

int rank[maxn],height[maxn];
void calheight(int *r,int *sa,int n)
{
	int i,j,k=0;
	for(i=1;i<=n;i++)rank[sa[i]]=i;
	for(i=0;i<n;height[rank[i++]]=k)
		for(k?k--:0,j=sa[rank[i]-1];r[i+k]==r[j+k];k++);
}


相关文章推荐

后缀数组详解

  • 2017年08月26日 11:21
  • 319KB
  • 下载

后缀数组的倍增法实现

  • 2013年12月13日 20:24
  • 17KB
  • 下载

后缀数组 最长不可重叠重复子串问题

时间限制:5000ms 单点时限:1000ms 内存限制:256MB 描述小Hi平时的一大兴趣爱好就是演奏钢琴。我们知道一个音乐旋律被表示为长度为 N 的数构成的数列。小Hi在练习过很多曲子以后...

后缀数组的构造和应用基础

  • 2010年09月13日 13:55
  • 393KB
  • 下载

hdu5442 后缀数组

第一道AC的后缀数组,总算也是深入理解了各个数组的意义 height数组连续>=length,就说明两个顺序相同,保证字母序最大的前提下,先开始位置小 再顺时针优先于逆时针 #include #...

关于网上搜查得到的3DC3的基于字符串后缀数组的排序方法的怀疑

最近整理笔试题,发现了在字符串处理中后缀数组的应用,随机翻看了下;网上最多的内容全部是应用一个叫“罗穗骞”的孩子的国家集训论文里面的内容, 其中比较全面讲解了后缀数组的应用问题,但是,就其3DC3的排...

后缀数组与应用

  • 2013年09月05日 20:25
  • 273KB
  • 下载
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:后缀数组
举报原因:
原因补充:

(最多只允许输入30个字)