题意
给出N个字符串Si和M个字符串Ti,要求对于每一个字符串Si求出一个最大的整数L,使得可以将Si分割成若干个连续的段,其中是某个Ti的子串且长度不小于L的段长的总和不小于|Si|*0.9。
分析
先对所有Ti建广义sam,然后把Si在sam上跑,求出g[i]表示以i为结尾的前缀最多可以匹配多少长度。
求g[i]具体的方法是,把整个串在sam上跑,设当前匹配到str[p-1]且位于sam的now节点,若ch[now,str[p]]不为0就往后跳,不然就让now在parents树上往上跳,直到跳到一个节点x满足ch[x,str[p]]不为0。
然后就可以dp来判定,设f[i]表示前i个位置分成若干段的最大答案,那么有f[i]=max(f[i-1],i-j+f[j]),其中i-g[i]<=j<=i-L。
这里看似只能用二分或者线段树来优化,但注意到起始位置i-g[i]其实是单调不减的,所以就可以用单调队列来优化啦。
代码
#include<iostream>
#include<cstdio>
#include<cstdlib>
#include<cstring>
#include<algorithm>
using namespace std;
const int N=2000005;
int q,n,m,sz,mx[N],fa[N],ch[N][2],f[N],que[N],g[N],last;
char str[N];
void ins(int x)
{
if (ch[last][x])
{
int p=last,q=ch[last][x];
if (mx[q]==mx[p]+1) last=q;
else
{
int nq=++sz;mx[nq]=mx[p]+1;
memcpy(ch[nq],ch[q],sizeof(ch[q]));
fa[nq]=fa[q];fa[q]=nq;
for (;ch[p][x]==q;p=fa[p]) ch[p][x]=nq;
last=nq;
}
return;
}
int p,q,np,nq;
p=last;last=np=++sz;mx[np]=mx[p]+1;
for (;p&&!ch[p][x];p=fa[p]) ch[p][x]=np;
if (!p) fa[np]=1;
else
{
q=ch[p][x];
if (mx[q]==mx[p]+1) fa[np]=q;
else
{
nq=++sz;mx[nq]=mx[p]+1;
memcpy(ch[nq],ch[q],sizeof(ch[q]));
fa[nq]=fa[q];fa[q]=fa[np]=nq;
for (;ch[p][x]==q;p=fa[p]) ch[p][x]=nq;
}
}
}
bool check(int mid)
{
int h=1,t=0;
for (int i=1;i<=n;i++)
{
int x=i-mid;
if (x>=0)
{
while (h<=t&&f[que[t]]-que[t]<f[x]-x) t--;
que[++t]=x;
}
while (h<=t&&que[h]<i-g[i]) h++;
f[i]=f[i-1];
if (h<=t) f[i]=max(f[i],i+f[que[h]]-que[h]);
}
return f[n]*10>=n*9;
}
int main()
{
scanf("%d%d",&q,&m);sz=1;
for (int i=1;i<=m;i++)
{
scanf("%s",str);int len=strlen(str);last=1;
for (int j=0;j<len;j++) ins(str[j]-'0');
}
while (q--)
{
scanf("%s",str+1);n=strlen(str+1);
int now=1,len=0;
for (int i=1,c=str[i]-'0';i<=n;i++,c=str[i]-'0')
{
if (ch[now][c]) now=ch[now][c],len++;
else
{
while (now&&!ch[now][c]) now=fa[now],len=mx[now];
if (!now) now=1;
else now=ch[now][c],len++;
}
g[i]=len;
}
int l=1,r=n;
while (l<=r)
{
int mid=(l+r)/2;
if (check(mid)) l=mid+1;
else r=mid-1;
}
printf("%d\n",l-1);
}
return 0;
}