LeetCode-面试题 17.13. 恢复空格
-.- 这题不会做,记录下大佬的题解(难度:中等)
一、题目内容
哦,不!你不小心把一个长篇文章中的空格、标点都删掉了,并且大写也弄成了小写。像句子"I reset the computer. It still didn’t boot!“已经变成了"iresetthecomputeritstilldidntboot”。在处理标点符号和大小写之前,你得先把它断成词语。当然了,你有一本厚厚的词典dictionary,不过,有些词没在词典里。假设文章用sentence表示,设计一个算法,把文章断开,要求未识别的字符最少,返回未识别的字符数。
注意:本题相对原题稍作改动,只需返回未识别的字符数
示例:
输入:
dictionary = [“looked”,“just”,“like”,“her”,“brother”]
sentence = “jesslookedjustliketimherbrother”
输出: 7
解释: 断句后为"jess looked just like tim her brother",共7个未识别字符。
提示:
0 <= len(sentence) <= 1000
dictionary中总字符数不超过 150000。
你可以认为dictionary和sentence中只包含小写字母。
二、题解过程
1、问题分析
求最值问题最先想到的就是动态规划问题。动态规划的核心问题就是穷举。因为要求最值,肯定要把所有可行的答案穷举出来,然后求最值。但是动态规划有点特别,因为这类问题存在[重叠子问题],如果暴力穷举的话,效率会及其底下,所以需要[备忘录]或者[DP table]
来优化穷举过程,避免不必要的计算。
2、转态定义
dp[i]
表示字符串的前i个字符的最少未匹配数
3、状态转移
假设当前我们已经考虑完了前 i -1
个字符了,对于前 i
个字符对应的最少未匹配数:
1)假设第i
个字符未匹配,则dp[i] = dp[i-1] +1
,即不匹配数加1;
2)遍历前i
个字符,若这些字符当中存在某一个下标以第idx
为开头,以第i
个字符为结尾的字符串刚好在字典中,则dp[i] = min(dp[i], dp[idx])
更新dp[i]
。
这里分析一下:什么情况下会取dp[i]
,什么情况下会取dp[idx]
?
1)取dp[i]
的情况:当字典中存在前一个字段的尾部分与后一个字段的头部分相同的情况如(like,key)
,此时出现"likey"
的字符串,遍历到 ‘y’
时,dp[idx]
取值会大于dp[i]
,多一;
2)取dp[idx]
的情况:当字典不存在上述的情况,则dp[idx]
会比较小,是因为dp[idx]
到dp[i]
的字符串满足字典,这个字符串被隐掉,dp[i]
的值等于dp[idx]
的值。
4、解法一代码:
时间复杂度是 O(n^2)
,n 为待匹配字符串的长度。
// A code block
Class Solution{
public int replace(String[] dictionary,String sentence){
Set<String> dict = new HashSet<>(Arrays.asList(dictionary));
int n = sentence.length();
int[] dp = new int[n+1];
for(int i=1;i<=n;i++){
dp[i] = dp[i-1]+1;
for(int idx=0;idx<i;idx++){
if(dict.contains(sentence.substring(idx,i))){
dp[i] = Math.min(dp[i],dp[idx]);
}
}
}
return dp[n];
}
}
5、优化方法
考虑到字典中的长度是固定的,因此不需要每次idx
都从0开始,优化后代码如下:
class Solution {
public int respace(String[] dictionary, String sentence) {
int maxLength=0;
for(int i=0;i<dictionary.length;i++){
maxLength = maxLength>dictionary[i].length()?maxLength:dictionary[i].length();
}
Set<String> dict = new HashSet<>(Arrays.asList(dictionary));
int n = sentence.length();
int[] dp = new int[n+1];
for(int i=1;i<=n;i++){
dp[i] = dp[i-1]+1;
if(i<=maxLength){
for(int idx=0;idx<i;idx++){
if(dict.contains(sentence.substring(idx,i))){
dp[i] = Math.min(dp[i],dp[idx]);
}
}
}
else{
for(int idx=i-maxLength;idx<i;idx++){
if(dict.contains(sentence.substring(idx,i))){
dp[i] = Math.min(dp[i],dp[idx]);
}
}
}
}
return dp[n];
}
}
参考如下:
作者:sweetiee
链接:https://leetcode-cn.com/problems/re-space-lcci/solution/jian-dan-dp-trieshu-bi-xu-miao-dong-by-sweetiee/
来源:力扣(LeetCode)
著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。