算法设计与分析第八周——动态规划之Word Break

本文链接：https://blog.csdn.net/xun6838/article/details/83420424

算法设计与分析第八周——动态规划之Word Break

这周上课讲了动态规划——dynamic program，许多问题都可以化为一个动态规划的模型来求解，emmm，先来牛刀小试一下。

题目链接：Word Break

题目详情

题目大意：给出一个非空字符串s和含有多个字符串的字典集合，问s能否被分为由字典集合里的词语组成的一个句子（可能只是几个字典集合里的词语），词语可以重复，且字典里的词语不重复。

样例说明：

输入为：s = "leetcode", wordDict = ["leet", "code"]，那么返回真，因为s可以被拆分为“leet code”，两个词语又在字典集合里。
输入为：s = "applepenapple", wordDict = ["apple", "pen"]，返回真，因为s可以被拆分为“apple pen apple”。
输入为：s = "catsandog", wordDict = ["cats", "dog", "sand", "and", "cat"]，返回假，因为无论s怎样拆分，都不可以满足全部的单词都可以在集合里找到相应的词语。

题目分析和算法设计

我们可以遍历s来依次找出能在字典集合里找到的单词，并把它“分离出来”并标记找到匹配到的最后一个字符，然后再重新遍历找符合条件的，如果找到的词语在之前已经标记之后的，就再次标记匹配到的最后一个字符。我们使用动态规划来实现，众所周知，动态规划的重点和难点就在如何定义dp数组以及怎样推导状态转移方程，由上面的推导，我们可以设定dp数组，长度为sIFC长度加1，初始化全为假，注意dp[0]为真，其中dp[i]表示到 i 处为止，是满足能在字典集合里找到词语拆分s的，我们设定dp[i]为真，则如果s[i, j]为与字典集合里的一个单词匹配，那么此时可以得到dp[j]为真，即dp[j] = dp[i] && s[i, j] 在字典集合中。

于是我们可以使用两个循环来对s进行遍历，外循环为遍历s，内循环为从 j 处开始往前遍历字符串 [i, j]，找到满足状态转换的，设此时的 dp[j] 为真并退出内循环，直至最后如果dp[s.size()]为真，表明s能够被拆分为所有在字典集合里的单词的组合。

代码详情

bool wordBreak(string s, vector<string>& wordDict) {
        // dp[j] == true means s[i, j] is in the wordDict, 0 <= i < j 
        // dp[j] == true if dp[i] && s[i, j] is in the wordDict 
        bool dp[s.size() + 1];
        memset(dp, false, s.size() + 1);
        dp[0] = true;
        
        set<string> dict(wordDict.begin(), wordDict.end());
        
        for (int j = 1; j <= s.size(); j ++) {
        	for (int i = j - 1; i >= 0; i --) {
        		if (dp[i] && dict.find(s.substr(i, j - i)) != dict.end()) {
					dp[j] = true;
        			break;
				}
			}
		}
		
		return dp[s.size()];
    }

把vector里的元素存进set里的原因是set能使用find函数，直接查询当前的字符串是否在set内。

算法设计到两个循环，外循环为循环次数为|s|，内循环次数为j，故时间复杂度为O(n^2)。

以第一个例子来分析一下算法过程：

l e le e ee lee t et eet leet
C tC etC eetC leetC o Co tCo etCo eetCo leetCo d od Cod tCod etCod eetCod leetCod e de ode Code

于是dp的值为：T，F，F，F，T，F，F，F，T。

因此是函数返回true。