[SNOI2020] 字符串(后缀数组SA + 并查集)

题意

在这里插入图片描述

题解

网上很少能找到能看的后缀数组的题解,我就写一篇好了。

我们发现这道题很能兼容后缀数组,把两个串用特殊符号分隔开处理出 SA 和 h ,那么配对两个子串的代价就是 m 减去它们的 lcp 长度,而 lcp 则是两个串在 h 数组上的区间最小值。

这都是 SA 最常见的用法,可以说,这道题生下来就是为了 SA。

接下来怎么做呢 ?

贪心地想,我们可以尽量先把 lcp 长的两个串配对,
lcp 更长的串,那么它们在 SA 上相对来说就要隔得近一些,归纳一下四个点的情况,再类推就可以很好地证明或理解这个贪心思路,这样配对一定没有更优的方案,这里我就不画图列式证明了,没必要。

于是又是 SA 常有的操作:并查集

从 h 大的开始合并,合并途中算贡献。

详见代码

CODE

#include<vector>
#include<cstdio>
#include<cstring>
#include<iostream>
#include<algorithm>
using namespace std;
#define MAXN 300005
#define MAXC 26
#define LB 'a'
#define LL long long
#define DB double
#define ENDL putchar('\n')
LL read() {
	LL f = 1,x = 0;char s = getchar();
	while(s < '0' || s > '9') {if(s=='-')f = -f;s = getchar();}
	while(s >= '0' && s <= '9') {x=x*10+(s-'0');s = getchar();}
	return x * f;
}
const int MOD = 1000000007;
int n,m,i,j,s,o,k;
char ss[MAXN];
int a[MAXN];
int sa[MAXN],rk[MAXN],ht[MAXN],h[MAXN];
int rt[MAXN],nx[MAXN],tl[MAXN],pr[MAXN<<1];
int ins(int i,int x,int y) {return x==0 ? (rt[i]=y):(nx[x]=y);}
void INIT_SUFFIX_ARRAY(char *s,int *sa,int *rk,int n) {
	for(int i=1;i<=n;i++)sa[i]=rk[i]=rt[i]=nx[i]=tl[i]=pr[n+i]=0;
	for(int i = 1;i <= n;i ++) 
		nx[tl[0+s[i]] = ins(0+s[i],tl[0+s[i]],i)] = 0;
	int cn = 0,nm = 0;
	for(int i = 0;i <= 256;i ++) {
		int p = rt[i];if(p) nm ++;
		while(p) {
			sa[++ cn] = p; rk[p] = nm;
			if(p == tl[i]) break;
			p = nx[p];
		} rt[i] = tl[i] = 0;
	}
	for(int ii = 1;ii <= n;ii <<= 1) {
		for(int i = 1;i <= n;i ++) pr[i] = rk[i],rk[i] = 0;
		for(int i = n-ii+1;i <= n;i ++)
			nx[tl[pr[i]] = ins(pr[i],tl[pr[i]],i)] = 0;
		for(int i = 1;i <= n;i ++) {
			if(sa[i] <= ii) continue;
			nx[tl[pr[sa[i]-ii]] = ins(pr[sa[i]-ii],tl[pr[sa[i]-ii]],sa[i]-ii)] = 0;
		}
		cn = 0;nm = 0;
		for(int i = 1;i <= n;i ++) {
			int p = rt[i],pp = 0;
			while(p) {
				sa[++ cn] = p;
				rk[p] = ((!pp || pr[p+ii] != pr[pp+ii]) ? (++nm):nm);
				if(p == tl[i]) break;
				pp = p;p = nx[p];
			} rt[i] = tl[i] = 0;
		}
	}
	return ;
}
void INIT_HEIGHT(char *s,int *sa,int *rk,int *hi,int n) {
	hi[0] = 0;
	for(int i = 1;i <= n;i ++) {
		int k = sa[rk[i]-1];if(!k) {hi[i]=0;continue;}
		hi[i] = max(hi[i-1]-1,0);
		while(s[k+hi[i]] == s[i+hi[i]]) hi[i] ++;
	}
	return ;
}
int fa[MAXN],ct[MAXN];
int Abs(int x) {return x<0 ? -x:x;}
int findf(int x) {return x==fa[x] ? x:(fa[x] = findf(fa[x]));}
int unionSet(int a,int b) {
	int u = findf(a),v = findf(b),re = 0;
	if(ct[u]*1ll*ct[v] > 0) re = 0;
	else re = min(Abs(ct[u]),Abs(ct[v]));
	ct[v] = ct[u] + ct[v];
	fa[u] = v; return re;
}
vector<int> c[MAXN];
int main() {
	n = read();m = read();
	scanf("%s",ss + 1);
	ss[n+1] = '#';
	scanf("%s",ss + n + 2);
	int N = (n<<1|1);
	INIT_SUFFIX_ARRAY(ss,sa,rk,N);
	INIT_HEIGHT(ss,sa,rk,ht,N);
	for(int i = 1;i <= N;i ++) h[i] = ht[sa[i]];
	for(int i = 1;i <= N;i ++) {
		fa[i] = i;ct[i] = 0;
		if(sa[i] <= n-m+1) ct[i] = 1;
		else if(sa[i] > n+1 && sa[i] <= N-m+1) ct[i] = -1;
		if(i-1) c[h[i]].push_back(i);
	}
	LL ans = (n-m+1) *1ll* m;
	for(int i = n;i >= 0;i --) {
		for(int j = 0;j < (int)c[i].size();j ++) {
			int t = c[i][j];
			ans -= unionSet(t-1,t) *1ll* (min(i,m));
		}
	}
	printf("%lld\n",ans);
	return 0;
}
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值