# [USACO2.3]最长前缀 Longest Prefix
## 题目描述
在生物学中,一些生物的结构是用包含其要素的大写字母序列来表示的。生物学家对于把长的序列分解成较短的序列(即元素)很感兴趣。
如果一个集合 $P$ 中的元素可以串起来(元素可以重复使用)组成一个序列 $s$ ,那么我们认为序列 $s$ 可以分解为 $P$ 中的元素。元素不一定要全部出现(如下例中 `BBC` 就没有出现)。举个例子,序列 `ABABACABAAB` 可以分解为下面集合中的元素:`{A,AB,BA,CA,BBC}`
序列 $s$ 的前面 $k$ 个字符称作 $s$ 中长度为 $k$ 的前缀。设计一个程序,输入一个元素集合以及一个大写字母序列 ,设 $s'$ 是序列 $s$ 的最长前缀,使其可以分解为给出的集合 $P$ 中的元素,求 $s'$ 的长度 $k$。
## 输入格式
输入数据的开头包括若干个元素组成的集合 $O$,用连续的以空格分开的字符串表示。字母全部是大写,数据可能不止一行。元素集合结束的标志是一个只包含一个 `.` 的行,集合中的元素没有重复。
接着是大写字母序列 $s$ ,长度为,用一行或者多行的字符串来表示,每行不超过 $76$ 个字符。换行符并不是序列 $s$ 的一部分。
## 输出格式
只有一行,输出一个整数,表示 S 符合条件的前缀的最大长度。
## 样例 #1
### 样例输入 #1
```
A AB BA CA BBC
.
ABABACABAABC
```
### 样例输出 #1
```
11
```
## 提示
**【数据范围】**
对于 $100\%$ 的数据,$1\le \text{card}(P) \le 200$,$1\le |S| \le 2\times 10^5$,$P$ 中的元素长度均不超过 $10$。
翻译来自NOCOW
USACO 2.3
题目分析
首先正在学习kmp,所以“我”会很自然地想到怎么用kmp去求解呢?
。。。。。。
好的,我发现这道题yongdp求解会更简单。
为什么会是dp?
(1)根据数据范围,我们会发线单词集合中的每个元素是不会超过10的,而求解的前缀单词是不超过200000的
(2)我们联想一下如何暴力求解。
暴力求解最好的方式应该也是dp,但是朴素的思考,肯定会想到两层循环,一维的dp——>dp[i]表示以 1到i结尾的前缀匹配成功为1,不成功为0
那么最外围枚举匹配字符串的下标,内循环枚举小于i的下标,如果集合中存在j ~ i的字符串,而且dp[j] == 1那么dp[i] = 1
(3)我们根据数据范围思考如何优化
两层循环看起来很吓人,一定会超时,但是真的需要两层循环吗?
我们的集合中的每个单词的长度不超过10,那么我们让j等于从i开始向前寻找长度为j的串,如果i~ i - j的串存在在集合中而且dp[i - j] == 1那么dp[i] = 1,时间顿时往下降。
(4)细节小知识
string s, z ;
s = z.substr(字符串z的起始下标,从起始下标开始复制字串的长度) ;
set<string> P[15]
P[s.length()].count(s), 在长度为s.length()的字符串集合中是否存在s,存在返回1,不存在返回0
dp[0] = 1 ;
相当于从1开始刚好找到一个整的串可以匹配时,dp[i - j] = 1, 而且i - j == 0
枚举的时候是小于len。
代码
#include <bits/stdc++.h>
using namespace std ;
set<string> P[15] ;
string s, z ;
bool dp[200005] ;
int len, m = 0, ans = 0 ;
int main()
{
std::ios::sync_with_stdio(false) ;
std::cin.tie(0) ;
while(cin >> s)
{
if(s[0] == '.') break ;
len = s.length() ;
P[len].insert(s) ;
m = max(m, len) ;
}
z = " " ;
while(cin >> s) z = z + s ;
len = z.length() ;
dp[0] = 1 ;
for(int i = 1; i < len; i ++)//此处为小于
{
for(int j = min(i, m); j >= 1; j --)
{
s = z.substr(i - j + 1, j) ;
if(P[s.length()].count(s) && dp[i - j])
{
dp[i] = 1 ;
ans = i ;
}
}
}
printf("%d\n", ans) ;
}