后缀数组

原创 2013年12月03日 22:05:01

首先理解基数排序,该排序的优点是1、很快(和桶排一样适用于值域范围较小的情况)2、稳定排序,可以轻松地多关键字排序(只需要先按照次要关键字排序,在按照主要关键字排序)


sa数组存排第i的是谁。

rank数组存i排第几。

ws累计的作用是给位次较小的元素留够空间。


第一步排长度为2^0长度的区间。(初始化)

之后每次利用上次排序的结果作为次要关键字(即已经排好了次要关键字)。来对“排好序”的第一关键字排序。

直到字串变成一个完整的后缀。


第一关键字:b-->

第二关键字:b--a-->(等价于原来的a-->,即给他的起始位置挪一下,就从第一关键字变成了第二关键字)


最后一步删掉重复的后缀。


Height的计算:

位置相邻的两个后缀(不是名词相邻)重复数至少差1,靠前的重复数较多。

int wa[maxn],wb[maxn],wv[maxn],ws[maxn];
int cmp(int *r,int a,int b,int l)
{return r[a]==r[b]&&r[a+l]==r[b+l];}
void da(int *r,int *sa,int n,int m)
{
	int i,j,p,*x=wa,*y=wb,*t;
	for(i=0;i<m;i++) ws[i]=0;
	for(i=0;i<n;i++) ws[x[i]=r[i]]++;
	for(i=1;i<m;i++) ws[i]+=ws[i-1];
	for(i=n-1;i>=0;i--) sa[--ws[x[i]]]=i;
	for(j=1,p=1;p<n;j*=2,m=p)
	{
		for(p=0,i=n-j;i<n;i++) y[p++]=i;
		for(i=0;i<n;i++) if(sa[i]>=j) y[p++]=sa[i]-j;
		for(i=0;i<n;i++) wv[i]=x[y[i]];
		for(i=0;i<m;i++) ws[i]=0;
		for(i=0;i<n;i++) ws[wv[i]]++;
		for(i=1;i<m;i++) ws[i]+=ws[i-1];
		for(i=n-1;i>=0;i--) sa[--ws[wv[i]]]=y[i];
		for(t=x,x=y,y=t,p=1,x[sa[0]]=0,i=1;i<n;i++)
			x[sa[i]]=cmp(y,sa[i-1],sa[i],j)?p-1:p++;
	}
	return;
}

int rank[maxn],height[maxn];
void calheight(int *r,int *sa,int n)
{
	int i,j,k=0;
	for(i=1;i<=n;i++)rank[sa[i]]=i;
	for(i=0;i<n;height[rank[i++]]=k)
		for(k?k--:0,j=sa[rank[i]-1];r[i+k]==r[j+k];k++);
}


五分钟搞懂后缀数组!后缀数组解析以及应用(附详解代码)

这是一篇本人自己对后缀数组的一些理解,有详细的说明以及附有详解的代码。...
  • YxuanwKeith
  • YxuanwKeith
  • 2016年02月05日 13:13
  • 17583

后缀数组罗穗蹇模板(dc3)

#include #include #include #include #define maxn 1000003 #define F(x) ((x)/3+((x)%3==1?0:tb)) #defin...
  • u013665921
  • u013665921
  • 2014年10月14日 09:52
  • 1396

后缀数组倍增法

那夜风,宫灯昏暗,小楼听雨灯辉摇梦
  • reverie_mjp
  • reverie_mjp
  • 2016年04月17日 22:04
  • 496

后缀数组:原理和实现

后缀数组(Suffix Array)是某一字符串的所有后缀按照字典序的一个排列。本文数组的索引从0开始。称s[j..len(s)-1]为后缀j。sa[i] = j,表示原串的所有后缀按字典序排列,排在...
  • ruoruo_cheng
  • ruoruo_cheng
  • 2016年08月21日 21:47
  • 1820

后缀数组详解

转载自 : http://blog.csdn.net/j_sure/article/details/41777097 后缀数组学习笔记【详解】 老天,一个后缀数组不知道看了多少天,最后...
  • qq_34731703
  • qq_34731703
  • 2016年10月26日 14:50
  • 3552

后缀数组练习题若干

POJ 1743    不可重叠最长重复子串 二分答案。 即子串的长度,假设为k时。 利用height数组,将排序后的后缀分为若干组。 每组内的height值都不小于k。 然后只需查看组内是否有满足要...
  • sdj222555
  • sdj222555
  • 2013年10月13日 21:00
  • 2483

HDU 1403 Longest Common Substring(后缀数组入门)

传送门:http://acm.hdu.edu.cn/showproblem.php?pid=1403拖了这么久的后缀数组,终于准备学一学了。 做的第一题(套的第一个板子),虽然还是没看不懂是怎么实现...
  • xtttgo
  • xtttgo
  • 2016年08月14日 10:28
  • 262

实用算法实现-第8篇 后缀树和后缀数组 [1简介]

8.1    后缀树 一棵后缀树包含一个指定文本的所有后缀,对于在一个长度为N的文本中查找一个长度为M的子字符串,一个后缀树仅仅需要M次比较,而这个比较次数是查找该字符串所需要的最小比较次数。 后...
  • fsdev
  • fsdev
  • 2011年10月15日 11:50
  • 3815

练习——后缀数组题目

BZOJ 1717 题意:给一个字符串,求最长的出现至少K次的子串,子串可以重叠。 难度:* 和模型一样,直接上。 CODE: #include #include #include using...
  • ALXPCUN
  • ALXPCUN
  • 2016年04月27日 09:03
  • 574

后缀数组——罗穗骞倍增算法代码详解

首先解释一下用到的几个数组。 数组sa:构造完成前表示关键字数组,下标表示名次,值表示关键字的首字符位置,值相同的时候名次根据在原串中相对位置的先后决定;构造完成后表示后缀数组,下标表示名次,值表示...
  • rockzh1993
  • rockzh1993
  • 2015年12月19日 10:28
  • 1908
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:后缀数组
举报原因:
原因补充:

(最多只允许输入30个字)