题目地址:
https://www.lintcode.com/problem/word-break-iii/
给定一个字符串 s s s,另外给出一个字符串列表 A A A,问 s s s可以由列表中字符串拼接而成的方案数。题目要求忽略大小写。
思路是动态规划 + 字符串哈希。先哈希一下 A A A里的所有字符串,然后将哈希值存入一个哈希表里;接着再求一下 s s s的前缀哈希数组,这样可以快速判断 s s s的某个子串是否在 A A A里了。然后开始用动态规划,设 f [ i ] f[i] f[i]是 s s s的前 i i i个字符能被 A A A里字符串拼接的方式。则 f [ 0 ] = 1 f[0]=1 f[0]=1表示空串有一种方式。接着开始枚举最后一个拼接的单词的开始位置,有: f [ i ] = ∑ s [ j : i − 1 ] ∈ A f [ j ] f[i]=\sum_{s[j:i-1]\in A} f[j] f[i]=s[j:i−1]∈A∑f[j]代码如下:
import java.util.HashSet;
import java.util.Set;
public class Solution {
/*
* @param : A string
* @param : A set of word
* @return: the number of possible sentences.
*/
public int wordBreak3(String s, Set<String> dict) {
// Write your code here
s = s.toLowerCase();
// 哈希一下dict里所有字符串,将哈希值存入set
Set<Long> set = new HashSet<>();
long P = 131;
for (String str : dict) {
long hash = 0;
str = str.toLowerCase();
for (int i = 0; i < str.length(); i++) {
hash = hash * P + str.charAt(i);
}
set.add(hash);
}
// 求s的前缀哈希数组,并缓存一下P的各个次方,以便快速求出s的任意子串的哈希值
long[] hashS = new long[s.length() + 1], pow = new long[s.length() + 1];
pow[0] = 1;
for (int i = 0; i < s.length(); i++) {
hashS[i + 1] = hashS[i] * P + s.charAt(i);
pow[i + 1] = pow[i] * P;
}
// dp[i]是s[0 : i - 1]能被拆分的方案数
int[] dp = new int[s.length() + 1];
// 空串有一种拆分方式,就是一个也不选
dp[0] = 1;
for (int i = 1; i <= s.length(); i++) {
// 枚举最后一次拼接的子串开始位置
for (int j = 0; j < i; j++) {
// 求一下s[j : i - 1]的哈希值
long hash = hashS[i] - hashS[j] * pow[i - j];
// 如果其包含在set里,说明s[j : i - 1]可以由A中的单词填补,
// 此时方案数就是s[0 : j - 1]的切割方案数,也就是dp[j]
if (set.contains(hash)) {
dp[i] += dp[j];
}
}
}
return dp[s.length()];
}
}
时间复杂度 O ( l 2 ) O(l^2) O(l2), l l l是 s s s的长度,空间 O ( l + n ) O(l+n) O(l+n), n n n是字典里字符串的个数。