算法设计与分析第八周——动态规划之Word Break
这周上课讲了动态规划——dynamic program,许多问题都可以化为一个动态规划的模型来求解,emmm,先来牛刀小试一下。
题目链接:Word Break
题目详情
题目大意:给出一个非空字符串s和含有多个字符串的字典集合,问s能否被分为由字典集合里的词语组成的一个句子(可能只是几个字典集合里的词语),词语可以重复,且字典里的词语不重复。
样例说明:
- 输入为:s = "leetcode", wordDict = ["leet", "code"],那么返回真,因为s可以被拆分为“leet code”,两个词语又在字典集合里。
- 输入为:s = "applepenapple", wordDict = ["apple", "pen"],返回真,因为s可以被拆分为“apple pen apple”。
- 输入为:s = "catsandog", wordDict = ["cats", "dog", "sand", "and", "cat"],返回假,因为无论s怎样拆分,都不可以满足全部的单词都可以在集合里找到相应的词语。
题目分析和算法设计
我们可以遍历s来依次找出能在字典集合里找到的单词,并把它“分离出来”并标记找到匹配到的最后一个字符,然后再重新遍历找符合条件的,如果找到的词语在之前已经标记之后的,就再次标记匹配到的最后一个字符。我们使用动态规划来实现,众所周知,动态规划的重点和难点就在如何定义dp数组以及怎样推导状态转移方程,由上面的推导,我们可以设定dp数组,长度为sIFC长度加1,初始化全为假,注意dp[0]为真,其中dp[i]表示到 i 处为止,是满足能在字典集合里找到词语拆分s的,我们设定dp[i]为真,则如果s[i, j]为与字典集合里的一个单词匹配,那么此时可以得到dp[j]为真,即dp[j] = dp[i] && s[i, j] 在字典集合中。
于是我们可以使用两个循环来对s进行遍历,外循环为遍历s,内循环为从 j 处开始往前遍历字符串 [i, j],找到满足状态转换的,设此时的 dp[j] 为真并退出内循环,直至最后如果dp[s.size()]为真,表明s能够被拆分为所有在字典集合里的单词的组合。
代码详情
bool wordBreak(string s, vector<string>& wordDict) {
// dp[j] == true means s[i, j] is in the wordDict, 0 <= i < j
// dp[j] == true if dp[i] && s[i, j] is in the wordDict
bool dp[s.size() + 1];
memset(dp, false, s.size() + 1);
dp[0] = true;
set<string> dict(wordDict.begin(), wordDict.end());
for (int j = 1; j <= s.size(); j ++) {
for (int i = j - 1; i >= 0; i --) {
if (dp[i] && dict.find(s.substr(i, j - i)) != dict.end()) {
dp[j] = true;
break;
}
}
}
return dp[s.size()];
}
把vector里的元素存进set里的原因是set能使用find函数,直接查询当前的字符串是否在set内。
算法设计到两个循环,外循环为循环次数为|s|,内循环次数为j,故时间复杂度为O(n^2)。
以第一个例子来分析一下算法过程:
l e le e ee lee t et eet leet
C tC etC eetC leetC o Co tCo etCo eetCo leetCo d od Cod tCod etCod eetCod leetCod e de ode Code
于是dp的值为:T,F,F,F,T,F,F,F,T。
因此是函数返回true。
总结与思考
虽然这周的题目比较简单,但旨在了解和熟悉动态规划,而动态规划的难点和重点在于dp数组的构建和状态方程的推导了,如何把题目分为子问题和推导出状态转换方程,那么很多题目都可以迎刃而解。
谢谢阅读。
参考资料: