题意:给 N N N个由大小写字母、数字组成的字符串,两个字符串 S , T S,T S,T合并时,删除 T T T最长的是 S S S的后缀的前缀,然后接在一起。现将这些字符串依次合并,求最终字符串。
N ≤ 1 e 5 , ∑ ∣ S i ∣ ≤ 1 e 6 N \leq 1e5,\sum|S_i|\leq 1e6 N≤1e5,∑∣Si∣≤1e6
首先字符集有 60 60 60多,显然在卡自动机。
字符集无关的算法有
k
m
p
,
m
a
n
a
c
h
e
r
,
S
A
,
kmp,manacher,SA,
kmp,manacher,SA,哈希
m a n a c h e r manacher manacher不现实, S A SA SA不好做
考虑 k m p kmp kmp
维护当前串 S S S,每次读入一个串 T T T,求出 T T T的 n e x t next next数组,用 S S S去匹配,最后的 j j j就是最长公共前后缀,把后面的加入 S S S
赛场上这样就得到了 O ( ∑ ∣ S i ∣ 2 ) O(\sum |S_i|^2) O(∑∣Si∣2)的优秀做法
冷静分析,我们发现 S S S前面的位置即使配出来了也对答案没有贡献
即:只有最后 ∣ T ∣ |T| ∣T∣的位置是有用的
所以匹配时可以只跑最后 ∣ T ∣ |T| ∣T∣个
复杂度 O ( ∑ ∣ S i ∣ ) O(\sum |S_i|) O(∑∣Si∣)
#include <iostream>
#include <cstdio>
#include <cstring>
#include <cctype>
#define MAXN 1000005
using namespace std;
char s[MAXN],t[MAXN];
int nxt[MAXN];
int main()
{
int n;
scanf("%d",&n);
scanf("%s",s+1);
int now=strlen(s+1);
for (int c=2;c<=n;c++)
{
scanf("%s",t+1);
int m=strlen(t+1);
nxt[0]=nxt[1]=0;
int j=0;
for (int i=2;i<=m;i++)
{
while (j&&t[i]!=t[j+1]) j=nxt[j];
if (t[i]==t[j+1]) ++j;
nxt[i]=j;
}
j=0;
for (int i=max(now-m+1,1);i<=now;i++)
{
while (j&&s[i]!=t[j+1]) j=nxt[j];
if (s[i]==t[j+1]) ++j;
}
for (++j;j<=m;++j) s[++now]=t[j];
}
puts(s+1);
return 0;
}