暑期集训开始了= = 挖个坑 看能不能填完。。。
网上各种题解的我就不贴代码了= =
1. hdu 1403/pku 2774
最长公共子串
没什么好说的。。。把2个字符串拼起来,中间用个不会出现的字符隔开,注意选答案的时候要保证2个height是来自于不同的串
2. pku1743
楼教男人8题之一!!
求不重叠的长度至少为k的子串
首先注意到要满足第二个条件的时候,相邻的数之间的差的序列应该是一样的,然后预处理 s[i] = s[i+1]-s[i]+88; 这样就能满足第二个条件了
然后二分判定答案,这里要说一下,网上好多程序用的是mmax-mmin>=mid 我觉得应该是mmax-mmin>mid 对于下面的数据来说
10
1 2 3 4 5 6 7 8 9 9
预处理后
89 89 89 89 89 89 89 89 88
答案应该是0,但是很多程序跑出来是5!!! 只能说数据弱了。。。
3. pku3261
求最少重复k次的可重复子串的最大长度
二分答案len,然后利用height数组分组判断每组的长度是否大于等于len即可
4. spoj 694/spoj 705
求一个字符串的不同子串个数 求出height数组以后,按照suffix[sa[1]]~suffix[sa[n]]的顺序计算 答案为sigma(n-sa[i]-height[i])
5. poj 3693/spoj 687/hdu 2549
求循环次数最多的字典序最小的子串
http://blog.csdn.net/acm_cxlove/article/details/7941205
贴个爱神的解题报告 写的挺好的 注意一下求出suffix(i*l)和suffix((i+1)*l)的LCP(假设为m)后,这时最大循环次数为m/l+1,但是有可能初始位置不是刚好在i*l处,要再求suffix(i*l-(l-m%l))和suffix((i+1)*l-(l-m%l))的LCP,因为往后不能匹配更多了,往前的话如果能匹配到(i*l-(l-m%l))处,则循环次数可以再加一,每必要判断(i*l-(l-m%l))~(i*l)这之间的,因为不会对结果产生影响,(i*l-(l-m%l))之前的也不用判断了,因为前一组会判断的。
6.poj 3415
求长度至少为k的公共子串的个数
先求出height数组,然后按照sa数组的字典序开始求答案,维护sta,stb2个单调的栈,具体见代码
#include <iostream>
#include <cstdio>
#include <cstdlib>
#include <cassert>
#include <climits>
#include <ctime>
#include <numeric>
#include <vector>
#include <algorithm>
#include <bitset>
#include <cmath>
#include <cstring>
#include <iomanip>
#include <complex>
#include <deque>
#include <functional>
#include <list>
#include <map>
#include <string>
#include <sstream>
#include <set>
#include <stack>
#include <queue>
using namespace std;
template<class T> inline T sqr(T x) { return x * x; }
typedef long long LL;
typedef unsigned long long ULL;
typedef long double LD;
typedef pair<int, int> PII;
typedef pair<PII, int> PIII;
typedef pair<LL, LL> PLL;
typedef pair<LL, int> PLI;
typedef pair<LD, LD> PDD;
#define MP make_pair
#define PB push_back
#define sz(x) ((int)(x).size())
#define clr(ar,val) memset(ar, val, sizeof(ar))
#define istr stringstream
#define FOR(i,n) for(int i=0;i<(n);++i)
const double EPS = 1e-6;
const int INF = 0x3fffffff;
const LL LINF = INF * 1ll * INF;
const double PI = acos(-1.0);
using namespace std;
#define MAXN 200005
char s[MAXN],s2[MAXN];
int sa[MAXN],t[MAXN],t2[MAXN],c[MAXN],rank[MAXN],height[MAXN];
void build_sa(int n){
int *x = t,*y = t2;
int m = 256;
for(int i = 0;i<m;i++) c[i] = 0;
for(int i = 0;i<n;i++) c[x[i] = s[i]]++;
for(int i = 1;i<m;i++) c[i]+=c[i-1];
for(int i = n-1;i>=0;i--) sa[--c[x[i]]] = i;
for(int k = 1;k<=n;k<<=1){
int p = 0;
for(int i = n-k;i<n;i++) y[p++] = i;
for(int i = 0;i<n;i++) if(sa[i]>=k) y[p++] = sa[i]-k;
for(int i = 0;i<m;i++) c[i] = 0;
for(int i = 0;i<n;i++) c[x[y[i]]]++;
for(int i = 1;i<m;i++) c[i]+=c[i-1];
for(int i = n-1;i>=0;i--) sa[--c[x[y[i]]]] = y[i];
int *tmp = x;x = y;y = tmp;
p = 1,x[sa[0]] = 0;
for(int i = 1;i<n;i++)
x[sa[i]] = y[sa[i]]==y[sa[i-1]]&&y[sa[i]+k]==y[sa[i-1]+k]?p-1:p++;
if(p>=n) break;
m = p;
}
}
void getHeight(int n){
for(int i = 0;i<=n;i++) rank[sa[i]] = i;
int k = 0;
for(int i = 0;i<n;i++){
if(k) --k;
int j = sa[rank[i]-1];
while(s[i+k]==s[j+k]) k++;
height[rank[i]] = k;
}
}
int main(void){
#ifndef ONLINE_JUDGE
freopen("data.in","r",stdin);
#endif
int k;
while(scanf("%d",&k)!=EOF){
if(!k) break;
scanf("%s",s);
int n = strlen(s);
int l1 = n;
s[n++] = '#';
scanf("%s",s2);
for(int i = 0;s2[i];i++) s[n++] = s2[i];
s[n] = '\0';
build_sa(n+1);
getHeight(n);
LL A = 0,B = 0,ans = 0;
stack<PII> sta,stb;
for(int i = 1;i<=n;i++){
if(height[i]<k){
while(!sta.empty()) sta.pop();
while(!stb.empty()) stb.pop();
A = B = 0;
continue;
}
int cntA = 0,cntB = 0;
while(!sta.empty()){
PII p = sta.top();
if(p.first>height[i]-k+1){
A-=1ll*p.first*p.second;
cntA+=p.second;
sta.pop();
}
else break;
}
while(!stb.empty()){
PII p = stb.top();
if(p.first>height[i]-k+1){
B-=1ll*p.first*p.second;
cntB+=p.second;
stb.pop();
}else break;
}
if(sa[i-1]<l1) cntA++;
else cntB++;
if(cntA) sta.push(MP(height[i]-k+1,cntA));
if(cntB) stb.push(MP(height[i]-k+1,cntB));
A+=(height[i]-k+1)*cntA;
B+=(height[i]-k+1)*cntB;
if(sa[i]<l1) ans+=B;
else ans+=A;
}
printf("%lld\n",ans);
}
}
7. spoj 220
求不重叠的在每一个字符串中都至少出现2次的最长字串
先求height数组,二分答案然后分组,统计每一组里面是否每一个字串的都出现了2次以上,然后不重叠的只要判断出现的这2次(或者更多)中的字串位置最大值与最小值的差是否大于二分的答案即可
8. poj 1226/hdu 1238
求在每个字串中都出现或者反转后出现的最长子串的长度
预处理每个字串比如abc 变成abc$cba 即用一个没出现过的字符连接原串和反转后的字串
再将所有的字串连接起来(注意每个子串要用不同的字符连接)
然后二分答案利用height数组对他们分组,看每一组是否在每个串中都出现了。
9. uva 10829
求字符串中满足UVU形式子串个数,其中V的长度固定为gap,U不能为空
首先枚举U的长度l,然后类似于poj3693那题的方法,将原串分为n/l组;
比如 bbaabaaaaa l = 2时,分成 bb | aa | ba | aa| aa
然后显然有个性质——左边的那个U必然要包含且只包含一个端点(其实右边也一样,但是我们只考虑左边来计数)
所以我们考虑每个端点i*l,以及右边i*l+gap+l位置往左和往右最长能匹配的长度LL(往右的用后缀数组求字符串height数组+RMQ,往左的求字符串反向的height数组+RMQ)
每次加上LL - l就得到最后的答案了,注意有可能匹配的长度LL会超过2*l,这时就会包含2个以上的端点,所以在求匹配长度时要加个限制,具体看代码。
#include <iostream>
#include <cstdio>
#include <cstdlib>
#include <cassert>
#include <climits>
#include <ctime>
#include <numeric>
#include <vector>
#include <algorithm>
#include <bitset>
#include <cmath>
#include <cstring>
#include <iomanip>
#include <complex>
#include <deque>
#include <functional>
#include <list>
#include <map>
#include <string>
#include <sstream>
#include <set>
#include <stack>
#include <queue>
using namespace std;
template<class T> inline T sqr(T x) { return x * x; }
typedef long long LL;
typedef unsigned long long ULL;
typedef long double LD;
typedef pair<int, int> PII;
typedef pair<PII, int> PIII;
typedef pair<LL, LL> PLL;
typedef pair<LL, int> PLI;
typedef pair<LD, LD> PDD;
#define MP make_pair
#define PB push_back
#define sz(x) ((int)(x).size())
#define clr(ar,val) memset(ar, val, sizeof(ar))
#define istr stringstream
#define FOR(i,n) for(int i=0;i<(n);++i)
const double EPS = 1e-6;
const int INF = 0x3fffffff;
const LL LINF = INF * 1ll * INF;
const double PI = acos(-1.0);
using namespace std;
#define MAXN 50005
char s[MAXN],s2[MAXN];
int sa[MAXN],t1[MAXN],t2[MAXN],c[MAXN],rank[MAXN],height[MAXN];
int sa2[MAXN],rank2[MAXN],height2[MAXN];
int d1[16][MAXN],d2[16][MAXN];
void build_sa(int n,int *sa,char *s){
int *x = t1,*y = t2;
int m = 128;
for(int i = 0;i<m;i++) c[i] = 0;
for(int i = 0;i<n;i++) c[x[i] = s[i]]++;
for(int i = 1;i<m;i++) c[i]+=c[i-1];
for(int i = n-1;i>=0;i--) sa[--c[x[i]]] = i;
for(int k = 1;k<=n;k<<=1){
int p = 0;
for(int i = n-k;i<n;i++) y[p++] = i;
for(int i = 0;i<n;i++) if(sa[i]>=k) y[p++] = sa[i]-k;
for(int i = 0;i<m;i++) c[i] = 0;
for(int i = 0;i<n;i++) c[x[y[i]]]++;
for(int i = 1;i<m;i++) c[i]+=c[i-1];
for(int i = n-1;i>=0;i--) sa[--c[x[y[i]]]] = y[i];
int *tmp = x;x = y;y = tmp;
p = 1;x[sa[0]] = 0;
for(int i = 1;i<n;i++)
x[sa[i]] = y[sa[i]]==y[sa[i-1]]&&y[sa[i]+k]==y[sa[i-1]+k]?p-1:p++;
if(p>=n) break;
m = p;
}
}
void getHeight(int n,char *s,int *sa,int *rank,int *height){
int k = 0;
for(int i = 0;i<=n;i++) rank[sa[i]] = i;
for(int i = 0;i<n;i++){
if(k) --k;
int j = sa[rank[i]-1];
while(s[i+k]==s[j+k]) k++;
height[rank[i]] = k;
}
}
void init_RMQ(int d[][MAXN],int *height,int n){
for(int i = 0;i<=n;i++) d[0][i] = height[i];
for(int i = 1;(1<<i)<=n;i++){
for(int j = 1;j+(1<<i)-1<=n;j++){
d[i][j] = min(d[i-1][j],d[i-1][j+(1<<(i-1))]);
}
}
}
int RMQ(int d[][MAXN],int l,int r){
int k = 0;
while(1<<(1+k)<=r-l+1) k++;
return min(d[k][l],d[k][r-(1<<k)+1]);
}
int main(void){
#ifndef ONLINE_JUDGE
freopen("data.in","r",stdin);
#endif
int t,ca = 1;
scanf("%d",&t);
while(t--){
int g;
scanf("%d %s",&g,s);
int n = strlen(s);
build_sa(n+1,sa,s);
getHeight(n,s,sa,rank,height);
for(int i = n-1;i>=0;i--) s2[i] = s[n-1-i];
s2[n] = '\0';
build_sa(n+1,sa2,s2);
getHeight(n,s2,sa2,rank2,height2);
init_RMQ(d1,height,n);
init_RMQ(d2,height2,n);
int ans = 0;
for(int l = 1;l<=n/2;l++){
for(int i = 0;i+g+l<n;i+=l){
int posl = rank[i],posr = rank[i+g+l];
if(posl>posr) posl^=posr^=posl^=posr;
int left = min(l,RMQ(d1,posl+1,posr));
posl = rank2[n-1-i],posr = rank2[n-1-i-g-l];
if(posl>posr) posl^=posr^=posl^=posr;
int right = min(l,RMQ(d2,posl+1,posr));
int lcp = left+right;
if(lcp>l) ans+=lcp-l;
}
}
printf("Case %d: %d\n",ca++,ans);
}
}