题意
给定n个长度总和不超过10W的字符串,求一个最短的母串,使所有字符串的出现次数之和=m 这n个字符串保证不互相包含
分析
一开始题目没有给出字符串总长,以为就是AC自动机上dp+矩阵乘法随便优化一下就好了。。。
既然不能对长度和字符集dp,那我们就可以考虑对字符串dp。
设f[i,j]表示j接到i后面最少增加多少个字符。
看到m辣么大,很容易想到倍增,那我们就可以用f[i,j,k]表示i后面接长度为2^k个字符串且最有一个为j时的最小长度。转移的话就像floyd那样即可。
一开始在预处理f[i,j,0]的时候,我用的是hash+二分,后来对拍发现原来这个东西是不满足二分性的,随手画一下就知道了。
其实f[i,j,0]是可以直接hash+枚举的,算了一下总复杂度是O(nL),不会T。
注意倍增数组最好滚动,不然会T。
代码
#include<iostream>
#include<cstdio>
#include<cstdlib>
#include<cstring>
#include<algorithm>
#include<cmath>
using namespace std;
typedef long long LL;
const int N=205;
const int L=100005;
const int MOD1=233333333;
const int MOD2=1000000007;
const LL inf=1e17;
int n,m,hash1[N][L],hash2[N][L],mi1[L],mi2[L],len[N];
LL f[N][N],ans[N],tmp[N],g[N][N];
char ch[L];
int get_dis(int x,int y)
{
int lim=min(len[x],len[y]);
if (x==y) lim--;
for (int l=lim;l;l--)
{
int u1=(hash1[x][len[x]]-(LL)hash1[x][len[x]-l]*mi1[l]%MOD1+MOD1)%MOD1;
int v1=(hash2[x][len[x]]-(LL)hash2[x][len[x]-l]*mi2[l]%MOD2+MOD2)%MOD2;
int u2=hash1[y][l],v2=hash2[y][l];
if (u1==u2&&v1==v2) return len[y]-l;
}
return len[y];
}
int main()
{
scanf("%d%d",&n,&m);
int mxl=0;
for (int i=1;i<=n;i++)
{
scanf("%s",ch+1);
len[i]=strlen(ch+1);
mxl=max(mxl,len[i]);
for (int j=1;j<=len[i];j++)
{
hash1[i][j]=((LL)hash1[i][j-1]*27%MOD1+ch[j]-'a'+1)%MOD1;
hash2[i][j]=((LL)hash2[i][j-1]*27%MOD2+ch[j]-'a'+1)%MOD2;
}
}
mi1[0]=mi2[0]=1;
for (int i=1;i<=mxl;i++) mi1[i]=(LL)mi1[i-1]*27%MOD1,mi2[i]=(LL)mi2[i-1]*27%MOD2;
for (int i=1;i<=n;i++)
for (int j=1;j<=n;j++)
f[i][j]=get_dis(i,j);
int T=log(m)/log(2)+0.1;
for (int i=1;i<=n;i++) ans[i]=len[i];
m--;
for (int l=0;l<=T;l++)
{
if ((m&(1<<l)))
{
for (int j=1;j<=n;j++) tmp[j]=inf;
for (int j=1;j<=n;j++)
for (int k=1;k<=n;k++)
tmp[k]=min(tmp[k],ans[j]+f[j][k]);
for (int j=1;j<=n;j++) ans[j]=tmp[j];
}
for (int i=1;i<=n;i++)
for (int j=1;j<=n;j++)
{
g[i][j]=inf;
for (int k=1;k<=n;k++)
g[i][j]=min(g[i][j],f[i][k]+f[k][j]);
}
for (int i=1;i<=n;i++)
for (int j=1;j<=n;j++)
f[i][j]=g[i][j];
}
LL mn=inf;
for (int i=1;i<=n;i++) mn=min(mn,ans[i]);
printf("%lld",mn);
return 0;
}