BZOJ2085[Poi2010] Hamsters
Description
Tz养了一群仓鼠,他们都有英文小写的名字,现在Tz想用一个字母序列来表示他们的名字,只要他们的名字是字母序列中的一个子串就算,出现多次可以重复计算。现在Tz想好了要出现多少个名字,请你求出最短的字母序列的长度是多少。
Input
输入:第一行n(1<=n<=200)和m(1<=m<=10的9次方),n表示有多少个仓鼠,m表示Tz希望出现名字的次数,接下来n行,每行都是仓鼠的名字(中间没有空格)。
子串总长度不超过10^5
子串不互相包含
Output
输出:一行,最短的字母序列的长度。
Sample Input
4 5
monika
tomek
szymon
bernard
Sample Output
23
Solution:
一个直观的感觉就是算出将
j
接在
然后我们可以用暴力+Hash解决这前一个操作。因为计算 dis[i][j] 时,需要for的长度是两个长度的最小值,显然当每个串长度相等时总复杂度最高,为O(nm),所以没有问题。(m为串总长度)
至于第二个部分,就要使用倍增Floyd,本博客中另有阐述,此处不再赘述。
#include<stdio.h>
#include<string.h>
#include<iostream>
#define ll long long
#define INF (1LL<<61)
#define P 1000000007
#define M 100005
#define B 200019
#define N 205
using namespace std;
int sz[N],Base[M],Hash[M],n;
char str[N][M];
void check(ll &a,ll b){
if(a>b)a=b;
}
struct Floyd{
ll d[N][N];
Floyd(){
for(int i=0;i<=n;i++)
for(int j=0;j<=n;j++)
d[i][j]=INF;
}
Floyd operator *(const Floyd &a)const{
Floyd res;
for(int i=0;i<=n;i++)
for(int j=0;j<=n;j++)
for(int k=0;k<=n;k++)
check(res.d[i][j],d[i][k]+a.d[k][j]);
return res;
}
}ans,A;
int GetHash(int L,int R){
return ((1LL*Hash[R]-1LL*Hash[L-1]*Base[R-L+1])%P+P)%P;
}
int calc(int a,int b){
int lena=sz[a]-sz[a-1],lenb=sz[b]-sz[b-1],res=-1;
int minlen=min(lena,lenb)-1;
for(int i=0;i<minlen;i++){
int t1=GetHash(sz[a-1]+lena-i-1,sz[a-1]+lena-1);
int t2=GetHash(sz[b-1],sz[b-1]+i);
if(t1==t2)res=i;
}
return res+1;
}
int main(){
int m;
scanf("%d %d",&n,&m);
Floyd ans,A;
sz[0]=1;Base[0]=1;
for(int i=1;i<=100000;i++)
Base[i]=1LL*Base[i-1]*B%P;
for(int i=1;i<=n;i++){
scanf("%s",str[i]);
int len=strlen(str[i]);
sz[i]=sz[i-1]+len;
for(int j=0;j<len;j++)
Hash[j+sz[i-1]]=(1LL*Hash[j+sz[i-1]-1]*B+str[i][j])%P;
}
for(int i=0;i<=n;i++)
for(int j=1;j<=n;j++){
if(i==0)A.d[i][j]=sz[j]-sz[j-1];
else A.d[i][j]=sz[j]-sz[j-1]-calc(i,j);
}
for(int i=0;i<=n;i++)
ans.d[i][i]=0;
while(m){
if(m&1)ans=ans*A;
A=A*A;
m>>=1;
}
ll min=INF;
for(int i=1;i<=n;i++)
if(ans.d[0][i]<min)min=ans.d[0][i];
cout<<min<<endl;
return 0;
}