后缀数组训练计划

暑期集训开始了= = 挖个坑 看能不能填完。。。

网上各种题解的我就不贴代码了= =


1.  hdu 1403/pku 2774 

     最长公共子串

     没什么好说的。。。把2个字符串拼起来,中间用个不会出现的字符隔开,注意选答案的时候要保证2个height是来自于不同的串

2. pku1743

     楼教男人8题之一!!

     求不重叠的长度至少为k的子串

     首先注意到要满足第二个条件的时候,相邻的数之间的差的序列应该是一样的,然后预处理   s[i] = s[i+1]-s[i]+88;  这样就能满足第二个条件了

     然后二分判定答案,这里要说一下,网上好多程序用的是mmax-mmin>=mid 我觉得应该是mmax-mmin>mid 对于下面的数据来说

     10

     1 2 3 4 5 6 7 8 9 9

     预处理后

     89 89 89 89 89 89 89 89 88

     答案应该是0,但是很多程序跑出来是5!!! 只能说数据弱了。。。

3.  pku3261 

     求最少重复k次的可重复子串的最大长度

     二分答案len,然后利用height数组分组判断每组的长度是否大于等于len即可

4. spoj 694/spoj 705

     求一个字符串的不同子串个数  求出height数组以后,按照suffix[sa[1]]~suffix[sa[n]]的顺序计算  答案为sigma(n-sa[i]-height[i])


5. poj 3693/spoj 687/hdu 2549

    求循环次数最多的字典序最小的子串

    http://blog.csdn.net/acm_cxlove/article/details/7941205

    贴个爱神的解题报告 写的挺好的  注意一下求出suffix(i*l)和suffix((i+1)*l)的LCP(假设为m)后,这时最大循环次数为m/l+1,但是有可能初始位置不是刚好在i*l处,要再求suffix(i*l-(l-m%l))和suffix((i+1)*l-(l-m%l))的LCP,因为往后不能匹配更多了,往前的话如果能匹配到(i*l-(l-m%l))处,则循环次数可以再加一,每必要判断(i*l-(l-m%l))~(i*l)这之间的,因为不会对结果产生影响,(i*l-(l-m%l))之前的也不用判断了,因为前一组会判断的。


6.poj 3415 

     求长度至少为k的公共子串的个数

     先求出height数组,然后按照sa数组的字典序开始求答案,维护sta,stb2个单调的栈,具体见代码

#include <iostream>
#include <cstdio>
#include <cstdlib>
#include <cassert>
#include <climits>
#include <ctime>
#include <numeric>
#include <vector>
#include <algorithm>
#include <bitset>
#include <cmath>
#include <cstring>
#include <iomanip>
#include <complex>
#include <deque>
#include <functional>
#include <list>
#include <map>
#include <string>
#include <sstream>
#include <set>
#include <stack>
#include <queue>
using namespace std;
template<class T> inline T sqr(T x) { return x * x; }
typedef long long LL;
typedef unsigned long long ULL;
typedef long double LD;
typedef pair<int, int> PII;
typedef pair<PII, int> PIII;
typedef pair<LL, LL> PLL;
typedef pair<LL, int> PLI;
typedef pair<LD, LD> PDD;
#define MP make_pair
#define PB push_back
#define sz(x) ((int)(x).size())
#define clr(ar,val) memset(ar, val, sizeof(ar))
#define istr stringstream
#define FOR(i,n) for(int i=0;i<(n);++i)
const double EPS = 1e-6;
const int INF = 0x3fffffff;
const LL LINF = INF * 1ll * INF;
const double PI = acos(-1.0);

using namespace std;

#define MAXN 200005
char s[MAXN],s2[MAXN];
int sa[MAXN],t[MAXN],t2[MAXN],c[MAXN],rank[MAXN],height[MAXN];

void build_sa(int n){
	int *x = t,*y = t2;
	int m = 256;
	for(int i = 0;i<m;i++) c[i] = 0;
	for(int i = 0;i<n;i++) c[x[i] = s[i]]++;
	for(int i = 1;i<m;i++) c[i]+=c[i-1];
	for(int i = n-1;i>=0;i--) sa[--c[x[i]]] = i;
	for(int k = 1;k<=n;k<<=1){
		int p = 0;
		for(int i = n-k;i<n;i++) y[p++] = i;
		for(int i = 0;i<n;i++) if(sa[i]>=k) y[p++] = sa[i]-k;
		for(int i = 0;i<m;i++) c[i] = 0;
		for(int i = 0;i<n;i++) c[x[y[i]]]++;
		for(int i = 1;i<m;i++) c[i]+=c[i-1];
		for(int i = n-1;i>=0;i--) sa[--c[x[y[i]]]] = y[i];
		int *tmp = x;x = y;y = tmp;
		p = 1,x[sa[0]] = 0;
		for(int i = 1;i<n;i++)
			x[sa[i]] = y[sa[i]]==y[sa[i-1]]&&y[sa[i]+k]==y[sa[i-1]+k]?p-1:p++;
		if(p>=n) break;
		m = p;
	}
}

void getHeight(int n){
	for(int i = 0;i<=n;i++) rank[sa[i]] = i;
	int k = 0;
	for(int i = 0;i<n;i++){
		if(k) --k;
		int j = sa[rank[i]-1];
		while(s[i+k]==s[j+k]) k++;
		height[rank[i]] = k;
	}
}

int main(void){
#ifndef ONLINE_JUDGE
	freopen("data.in","r",stdin);
#endif
	int k;
	while(scanf("%d",&k)!=EOF){
		if(!k) break;
		scanf("%s",s);
		int n = strlen(s);
		int l1 = n;
		s[n++] = '#';
		scanf("%s",s2);
		for(int i = 0;s2[i];i++) s[n++] = s2[i];
		s[n] = '\0';
		build_sa(n+1);
		getHeight(n);
		LL A = 0,B = 0,ans = 0;
		stack<PII> sta,stb;
		for(int i = 1;i<=n;i++){
			if(height[i]<k){
				while(!sta.empty()) sta.pop();
				while(!stb.empty()) stb.pop();
				A = B = 0;
				continue;
			}
			int cntA = 0,cntB = 0;
			while(!sta.empty()){
				PII p = sta.top();
				if(p.first>height[i]-k+1){
					A-=1ll*p.first*p.second;
					cntA+=p.second;
					sta.pop();
				}
				else break;
			}
			while(!stb.empty()){
				PII p = stb.top();
				if(p.first>height[i]-k+1){
					B-=1ll*p.first*p.second;
					cntB+=p.second;
					stb.pop();
				}else break;
			}
			if(sa[i-1]<l1) cntA++;
			else cntB++;
			if(cntA) sta.push(MP(height[i]-k+1,cntA));
			if(cntB) stb.push(MP(height[i]-k+1,cntB));
			A+=(height[i]-k+1)*cntA;
			B+=(height[i]-k+1)*cntB;
			if(sa[i]<l1) ans+=B;
			else ans+=A;
		}
		printf("%lld\n",ans);
	}
}



7. spoj 220

    求不重叠的在每一个字符串中都至少出现2次的最长字串

    先求height数组,二分答案然后分组,统计每一组里面是否每一个字串的都出现了2次以上,然后不重叠的只要判断出现的这2次(或者更多)中的字串位置最大值与最小值的差是否大于二分的答案即可


8. poj 1226/hdu 1238

     求在每个字串中都出现或者反转后出现的最长子串的长度

     预处理每个字串比如abc 变成abc$cba  即用一个没出现过的字符连接原串和反转后的字串 

    再将所有的字串连接起来(注意每个子串要用不同的字符连接) 

     然后二分答案利用height数组对他们分组,看每一组是否在每个串中都出现了。   


9.  uva 10829

      求字符串中满足UVU形式子串个数,其中V的长度固定为gap,U不能为空

      首先枚举U的长度l,然后类似于poj3693那题的方法,将原串分为n/l组;

     比如     bbaabaaaaa   l = 2时,分成    bb |  aa |  ba |  aa|  aa

      然后显然有个性质——左边的那个U必然要包含且只包含一个端点(其实右边也一样,但是我们只考虑左边来计数)

      所以我们考虑每个端点i*l,以及右边i*l+gap+l位置往左和往右最长能匹配的长度LL(往右的用后缀数组求字符串height数组+RMQ,往左的求字符串反向的height数组+RMQ)

     每次加上LL - l就得到最后的答案了,注意有可能匹配的长度LL会超过2*l,这时就会包含2个以上的端点,所以在求匹配长度时要加个限制,具体看代码。

     

#include <iostream>
#include <cstdio>
#include <cstdlib>
#include <cassert>
#include <climits>
#include <ctime>
#include <numeric>
#include <vector>
#include <algorithm>
#include <bitset>
#include <cmath>
#include <cstring>
#include <iomanip>
#include <complex>
#include <deque>
#include <functional>
#include <list>
#include <map>
#include <string>
#include <sstream>
#include <set>
#include <stack>
#include <queue>
using namespace std;
template<class T> inline T sqr(T x) { return x * x; }
typedef long long LL;
typedef unsigned long long ULL;
typedef long double LD;
typedef pair<int, int> PII;
typedef pair<PII, int> PIII;
typedef pair<LL, LL> PLL;
typedef pair<LL, int> PLI;
typedef pair<LD, LD> PDD;
#define MP make_pair
#define PB push_back
#define sz(x) ((int)(x).size())
#define clr(ar,val) memset(ar, val, sizeof(ar))
#define istr stringstream
#define FOR(i,n) for(int i=0;i<(n);++i)
const double EPS = 1e-6;
const int INF = 0x3fffffff;
const LL LINF = INF * 1ll * INF;
const double PI = acos(-1.0);

using namespace std;

#define MAXN 50005

char s[MAXN],s2[MAXN];
int sa[MAXN],t1[MAXN],t2[MAXN],c[MAXN],rank[MAXN],height[MAXN];
int sa2[MAXN],rank2[MAXN],height2[MAXN];
int d1[16][MAXN],d2[16][MAXN];

void build_sa(int n,int *sa,char *s){
	int *x = t1,*y = t2;
	int m = 128;
	for(int i = 0;i<m;i++) c[i] = 0;
	for(int i = 0;i<n;i++) c[x[i] = s[i]]++;
	for(int i = 1;i<m;i++) c[i]+=c[i-1];
	for(int i = n-1;i>=0;i--) sa[--c[x[i]]] = i;
	for(int k = 1;k<=n;k<<=1){
		int p = 0;
		for(int i = n-k;i<n;i++) y[p++] = i;
		for(int i = 0;i<n;i++) if(sa[i]>=k) y[p++] = sa[i]-k;
		for(int i = 0;i<m;i++) c[i] = 0;
		for(int i = 0;i<n;i++) c[x[y[i]]]++;
		for(int i = 1;i<m;i++) c[i]+=c[i-1];
		for(int i = n-1;i>=0;i--) sa[--c[x[y[i]]]] = y[i];
		int *tmp = x;x = y;y = tmp;
		p = 1;x[sa[0]] = 0;
		for(int i = 1;i<n;i++)
			x[sa[i]] = y[sa[i]]==y[sa[i-1]]&&y[sa[i]+k]==y[sa[i-1]+k]?p-1:p++;
		if(p>=n) break;
		m = p;
	}
}

void getHeight(int n,char *s,int *sa,int *rank,int *height){
	int k = 0;
	for(int i = 0;i<=n;i++) rank[sa[i]] = i;
	for(int i = 0;i<n;i++){
		if(k) --k;
		int j = sa[rank[i]-1];
		while(s[i+k]==s[j+k]) k++;
		height[rank[i]] = k;
	}
}	

void init_RMQ(int d[][MAXN],int *height,int n){
	for(int i = 0;i<=n;i++) d[0][i] = height[i];
	for(int i = 1;(1<<i)<=n;i++){
		for(int j = 1;j+(1<<i)-1<=n;j++){
			d[i][j] = min(d[i-1][j],d[i-1][j+(1<<(i-1))]);
		}
	}
}

int RMQ(int d[][MAXN],int l,int r){
	int k = 0;
	while(1<<(1+k)<=r-l+1) k++;
	return min(d[k][l],d[k][r-(1<<k)+1]);
}

int main(void){
#ifndef ONLINE_JUDGE 
      freopen("data.in","r",stdin);
#endif
	int t,ca = 1;
	scanf("%d",&t);
	while(t--){
		int g;
		scanf("%d %s",&g,s);
		int n = strlen(s);
		build_sa(n+1,sa,s);
		getHeight(n,s,sa,rank,height);
		for(int i = n-1;i>=0;i--) s2[i] = s[n-1-i];
		s2[n] = '\0';
		build_sa(n+1,sa2,s2);
		getHeight(n,s2,sa2,rank2,height2);
		init_RMQ(d1,height,n);
		init_RMQ(d2,height2,n);
		int ans = 0;
		for(int l = 1;l<=n/2;l++){
			for(int i = 0;i+g+l<n;i+=l){
				int posl = rank[i],posr = rank[i+g+l];
				if(posl>posr) posl^=posr^=posl^=posr;
				int left = min(l,RMQ(d1,posl+1,posr));
				posl = rank2[n-1-i],posr = rank2[n-1-i-g-l];
				if(posl>posr) posl^=posr^=posl^=posr;
				int right = min(l,RMQ(d2,posl+1,posr));
				int lcp = left+right;
				if(lcp>l) ans+=lcp-l;
			}
		}
		printf("Case %d: %d\n",ca++,ans);
	}
}


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值