1 题目
题目:单词拆分(Word Break)
描述:给定字符串 s 和单词字典 dict,确定 s 是否可以分成一个或多个以空格分隔的子串,并且这些子串都在字典中存在。
lintcode题号——107,难度——medium
样例1:
输入:
s = "lintcode"
dict = ["lint", "code"]
输出:true
解释:lintcode可以分成lint和code。
样例2:
输入:
s = "a"
dict = ["a"]
输出:true
解释:a在dict中。
2 解决方案
2.1 思路
使用动态规划的方式解,将状态定义为表示前i个字符可以被顺利拆分成能在字典中找到子串,则如果位置j+1到位置i的子串在字典中,且前j个子串能够顺利拆分,则前i个子串就能够顺利拆分,理清动态规划的四要素即可解出。
序列型动态规划:由于将状态定义成前i个字符的状态,所以前0个对象的状态~前i个对象的状态,一共有i+1个状态,所以容器的长度需要增加一位,注意与坐标型动态规划区分。
2.2 时间复杂度
本题动态规划的多重循环是对同一维的下标进行的,相当于在一个耗时n的循环内嵌套了同为耗时n的循环,时间复杂度为O(n^2)。
2.3 空间复杂度
使用了容量为n的数组,空间复杂度为O(n)。
3 源码
细节:
- 动态规划的四要素:状态、方程、初始化、答案。(四要素在之前的题目数字三角形1中有详细介绍)
- 状态:用
dp[i]
表示前i个字符可以被顺利拆分成能在字典中找到子串。 - 方程:如果位置j+1到位置i的子串在字典中,且前j个子串能够顺利拆分,则前i个子串就能够顺利拆分。
- 初始化:空串为真。
- 答案:整个字符串是否能被顺利拆分,即
dp[max]
。
本题需要提前计算字典中的最长单词的长度,用于加速搜索,如果当前子串已经超过字典中最大长度,则更大的子串也不需要再判断了。所以第二重循环中的j要从大到小遍历。
C++版本:
/**
* @param s: A string
* @param wordSet: A dictionary of words dict
* @return: A boolean
*/
bool wordBreak(string &s, unordered_set<string> &wordSet) {
// write your code here
if (s.empty())
{
return true;
}
// 提前计算字典中最长的单词长度
int maxLength = 0;
for (auto it : wordSet)
{
if (it.size() > maxLength)
{
maxLength = it.size();
}
}
// 状态:dp[i]表示前i个字符可以被顺利拆分成能在字典中找到子串
vector<int> dp(s.size() + 1);
// 初始化:空串为真
dp[0] = 1;
for (int i = 1; i < dp.size(); i++)
{
for (int j = i - 1; j >= 0; j--) // 为了加速搜索,j从大到小来循环
{
if (i - j > maxLength) // 为了加速搜索,如果j+1到位置i的子串已经超过字典中最大长度,则更大的子串不需要再判断了
{
break;
}
// 方程:如果位置j+1到位置i的子串在字典中,且前j个子串能够顺利拆分,则前i个子串就能够顺利拆分
if (wordSet.find(s.substr(j, i - j)) != wordSet.end() && dp[j] == 1)
{
dp[i] = 1;
break;
}
}
}
return dp[dp.size() - 1]; // 答案:整个字符串是否能被顺利拆分
}
数字三角形:https://blog.csdn.net/SeeDoubleU/article/details/124678103 ↩︎