题目地址:
https://leetcode.com/problems/word-break/
给定一个长 n n n的单词 s s s,和由一些单词构成的列表 A A A,问该单词能否被构成单词的列表里的单词所拼接而成。列表里的单词可以重复使用。
动态规划 + 字符串哈希。思路是,我们可以考虑该单词的切割位置,如果从某个位置之后形成的子串属于那个列表,那么该单词能否被拼接而成完全取决于其该位置之前的那个子串是否能被拼接而成。这样我们就把问题转化为一个规模更小的问题,从而可以用动态规划求解。判断单词的子串是否等于列表里某一个单词,可以用字符串哈希来加速。代码如下:
class Solution {
public:
using ull = unsigned long long;
bool wordBreak(string s, vector<string>& ws) {
const ull P = 131;
int n = s.size();
vector<ull> pow(n + 1), hs(n + 1);
pow[0] = 1;
for (int i = 0; i < n; i++)
pow[i + 1] = pow[i] * P, hs[i + 1] = hs[i] * P + s[i];
auto hash = [&](int l, int r) {
return hs[r + 1] - hs[l] * pow[r - l + 1];
};
// 接下来计算一下单词表里的单词的最短和最长长度,这样在枚举单词长度的时候就可以直接略过长度不符合要求的单词
int min_len = 2e9, max_len = 0;
unordered_set<ull> st;
for (auto& s : ws) {
int n = s.size();
min_len = min(min_len, n);
max_len = max(max_len, n);
ull ha = 0;
for (char ch : s) ha = ha * P + ch;
st.insert(ha);
}
// f[i]保存的是s[0,...,i]能否被成功切割
bool f[n];
memset(f, 0, sizeof f);
for (int i = 0; i < n; i++)
for (int j = 0; j <= i; j++)
// 如果s[j, ..., i]长度符合,又在字典里,说明可以切
if (i - j + 1 >= min_len && i - j + 1 <= max_len &&
st.count(hash(j, i))) {
// 如果j等于0,说明整个单词都在字典里,直接赋值为true
if (!j) f[i] = true;
else f[i] = f[j - 1];
if (f[i]) break;
}
return f[n - 1];
}
};
时间复杂度 O ( n 2 + l A L ) O(n^2+l_AL) O(n2+lAL),其中 n n n为字典的size, L L L为字典中的单词的最长长度,空间 O ( n + l A ) O(n+l_A) O(n+lA)。