题目大意
给出一个长度为 20 ∗ p ( ≤ 200 ) 20*p(\le 200) 20∗p(≤200) 的字符串 s t r str str,把它分成 k k k段。再给出 n n n个单词,求在这些段里最多能包含多少个给出的单词,两个单词可以存在部分重合,但选用之后第一个单词不能使用(例如字符串 t h i s this this中可包含 t h i s this this和 i s is is,选用 t h i s this this之后就不能包含 t h th th)。
解题思路
其实刚看到的这题我想的是枚举,但是一看数据,用枚举肯定会爆,所以要找其他的方法。再看题目,发现对于字符串中的某一段,它包含单词的数量只与它的子串截的单词数量有关系,于是这道题就满足了dp的条件。
由此,我们可以定义一个
s
u
m
sum
sum数组,表示字符串
s
r
t
srt
srt从第
i
i
i个到第
j
j
j字符中一共含有多少个单词,并进行dp。但是在wtj的这篇博客中,我们发现如果直接进行计算肯定会TLE,因此我们要找另外的优化方法。
最后,我发现可以从前一段子串包含的单词数中推出当前计算的的一段字符串中包含的单词数,(从后往前推)若是有一个单词的开头正好是当前这段字符串的开头,那么它就是一个新的单词,把它加到这段字符串所包含的单词数里。
预处理完毕,现在可以进行dp了,定义
f
f
f数组,
f
i
,
j
f_{i,j}
fi,j表示前
i
i
i个字符分成
j
j
j段能包含的最大单词数,每次枚举一个
l
l
l(
j
≤
l
≤
i
j \le l \le i
j≤l≤i),表示当前枚举的第
j
j
j段的开头,那么我们可以推出
f
i
,
j
=
m
a
x
(
f
i
,
j
,
f
l
−
1
,
j
−
1
+
s
u
m
l
−
1
,
i
−
1
)
f_{i,j}=max(f_{i,j},f_{l-1,j-1}+sum_{l-1,i-1})
fi,j=max(fi,j,fl−1,j−1+suml−1,i−1)
(在初始化的时候记得不管长度(
i
i
i),分一段都只包含
s
u
m
0
,
i
sum_{0,i}
sum0,i个单词。)
代码
#include<iostream>
#include<cstring>
#include<string>
#include<cstdio>
#include<cmath>
using namespace std;
string str,word[105];
int k,p,n,f[2005][500],sum[2005][2005];
int words(int l,int r)
{
int tot=0;
string st=str.substr(l,r-l+1);
for(int i=1;i<=n;i++)
if(st.find(word[i])==0) return 1;//如果新出现了一个单词就返回1
return 0;
}
void qwq()
{
for(int i=str.size()-1;i>=0;i--)//枚举子串的开头
for(int j=i;j<str.size();j++)//枚举子串的结尾
sum[i][j]=sum[i+1][j]+words(i,j);//前一段子串的包含数量加上是否出现新的单词
}
int main()
{
cin>>p>>k;
string s;
for(int i=1;i<=p;i++)
{
cin>>s;
str=str+s;
}
cin>>n;
for(int i=1;i<=n;i++)
cin>>word[i];
qwq();//预处理
for(int i=1;i<=str.size();i++)
f[i][1]=sum[0][i-1];//初始化
for(int i=1;i<=str.size();i++)//枚举分的长度
for(int j=2;j<=min(k,i);j++)//枚举分的段,如果i不够分k段就只能分i段
for(int l=j;l<=i;l++)//枚举当前这段的开头,超过已经分了的段且不超过要分的长度
{
f[i][j]=max(f[i][j],f[l-1][j-1]+sum[l-1][i-1]);
}
cout<<f[20*p][k];
return 0;
}