给定一个非空字符串 s 和一个包含非空单词的列表 wordDict,判定 s 是否可以被空格拆分为一个或多个在字典中出现的单词。
说明:
拆分时可以重复使用字典中的单词。
你可以假设字典中没有重复的单词。
示例 1:
输入: s = “leetcode”, wordDict = [“leet”, “code”]
输出: true
解释: 返回 true 因为 “leetcode” 可以被拆分成 “leet code”。
示例 2:
输入: s = “applepenapple”, wordDict = [“apple”, “pen”]
输出: true
解释: 返回 true 因为 “applepenapple” 可以被拆分成 “apple pen apple”。
注意你可以重复使用字典中的单词。
示例 3:
输入: s = “catsandog”, wordDict = [“cats”, “dog”, “sand”, “and”, “cat”]
输出: false
来源:力扣(LeetCode) 链接:https://leetcode-cn.com/problems/word-break
著作权归领扣网络所有。商业转载请联系官方授权,非商业转载请注明出处。
思路
这题要用动态规划来做,那么具体的状态转移方程还有数组的定义是什么呢?
初始化 dp=[False,⋯ ,False],长度为 n+1。n 为字符串长度。dp[i] 表示 s 的前 i 位是否可以用 wordDict 中的单词表示。
初始化 dp[0]=True,空字符可以被表示。
遍历字符串的所有子串,遍历开始索引 i,遍历区间 [0,n):
遍历结束索引 j,遍历区间 [i+1,n+1):
若 dp[i]=True 且 s[i,⋯ ,j) 在 wordlistwordlistwordlist 中:dp[j]=True。解释:dp[i]=True 说明 s 的前 i 位可以用 wordDict 表示,则 s[i,⋯ ,j) 出现在 wordDict 中,说明 s 的前 j 位可以表示。
返回 dp[n]
作者:wu_yan_zu
链接:https://leetcode-cn.com/problems/word-break/solution/dong-tai-gui-hua-ji-yi-hua-hui-su-zhu-xing-jie-shi/
来源:力扣(LeetCode)
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。
总的来说是这样的,dp数组表示字符串中这个位置能不能用字典来表示。下面放上代码在讲注意点
class Solution {
public boolean wordBreak(String s, List<String> wordDict) {
boolean[] dp = new boolean[s.length() + 1];
Arrays.fill(dp, false);
dp[0] = true;
for (int i = 0; i < s.length(); i++) {
if (!dp[i]) {
continue;
}
for (int j = i + 1; j < s.length() + 1; j++) {
if(wordDict.contains(s.substring(i ,j))) {
dp[j] = true;
}
}
}
return dp[s.length()];
}
}
这里代码中ij是从01开始,其中i就到字符串的倒数第二个字符,j到字符串的最后一个字符。在进入j的遍历之前会先判断当前i的dp值,因为如果当前i的dp为false,那么说明在这之前的位置是不能通过字典来凑出来的,那么就算后面的能通过字典凑出来也是没有意义的。
这里要讲一下s.substring里的参数的问题,这里困扰了我很久。
下面是dp数组的各个值,红色的字代表他们的角标
这里有一点需要注意的是在字符串s中的角标和在dp数组中的角标是不一样的。比如第一个字母l在dp数组中的角标就是1,而在字符串中的角标是0。
这也就意味着我们在dp中的角标的字符换算到字符串中相同的字符,它的角标是要-1的。
这么说有点抽象
举一个例子:当我们的dp数组遍历到0的时候,这时候dp【0】是默认值true,所以我们开起了j的遍历,从字母l开始。直到t这个字母得到时候我们才会遍历到字典中有的单词。这时候的i是0,而j是4。我们substring传入的参数就是0,4。substring方法是含头不含尾的,这也就是说我们实际截取的是字符串中0,1,2,3这四个角标的字符的内容,而这恰好就是leet。所以在dp【4】为true。
同理再举一个例子,在我们的dp数组的i遍历到了4的时候,此时我们的dp数组除了dp【0】和dp【4】都是false。接下来我们的j将从5开始遍历。头几次的遍历都是在词典中找不到这个词,直到j遍历到8的时候。此时的i为4,j为8,substring传入的参数就是4,8。那么它将截取字符串中4,5,6,7这四个角标得到字符,也就是code(在字符串中角标从0开始计数,所以4的角标对应的是第五个字符。而在dp数组中角标字符串的开始是1,所以4表示的是第四个字符,所以这里我们先判断了dp【4】是否为true,这表示了以第四个字符结尾的字符串能否在字典中找到,如果能才进行下面截取字符串的判断。有意思的地方就在于,截取字符串的时候我们传入的是4代表了字符串中的第五个字符,所以我们截取到的字符串的开始字符又是之前已经验证可以在字典中找到的字符串结尾的下一个)。所以这里dp【8】为true。