面试题 17.13. 恢复空格
哦,不!你不小心把一个长篇文章中的空格、标点都删掉了,并且大写也弄成了小写。像句子"I reset the computer. It still didn’t boot!"
已经变成了"iresetthecomputeritstilldidntboot"
。在处理标点符号和大小写之前,你得先把它断成词语。当然了,你有一本厚厚的词典dictionary
,不过,有些词没在词典里。假设文章用sentence
表示,设计一个算法,把文章断开,要求未识别的字符最少,返回未识别的字符数。
**注意:**本题相对原题稍作改动,只需返回未识别的字符数
示例:
输入:
dictionary = ["looked","just","like","her","brother"]
sentence = "jesslookedjustliketimherbrother"
输出: 7
解释: 断句后为"jess looked just like tim her brother",共7个未识别字符。
提示:
0 <= len(sentence) <= 1000
dictionary
中总字符数不超过 150000。- 你可以认为
dictionary
和sentence
中只包含小写字母。
我现在看到这种题就想动态规划,一般八九不离十。先上一个初版代码:
class Solution {
public int respace(String[] dictionary, String sentence) {
List<String> list = Arrays.asList(dictionary);
int len = sentence.length();
int[] dp = new int[len+1];
Arrays.fill(dp,Integer.MAX_VALUE);
dp[0] = 0;
for(int i = 1 ; i<=len ; i++){
for(int j = i ; j>0 ; j--){
String s = sentence.substring(j-1,i);
if(list.contains(s)){
dp[i] = Math.min(dp[i],dp[j-1]);
}
else{
dp[i] = Math.min(dp[i],dp[j-1]+i-j+1);
}
}
}
return dp[len];
}
}
思路很明确,每次添加一个字符长度以后,安置空格位置,判断是否可以通过安置到当前位置空格来使未识别字符达到最少。问题是,时间复杂度有点高了,结果也是超时了。所以得想办法去除一些不必要的判断。
加了长度的判断,还是超时,疯狂超时。想点别的办法。
参考了一下别人的方法,发现可以直接遍历字典的。。。就省去了一层for。时间复杂度骤降。。代码如下:
class Solution {
public int respace(String[] dictionary, String sentence) {
int len = sentence.length();
int[] dp = new int[len+1];
dp[0] = 0;
for(int i = 1 ; i<=len ; i++){
dp[i] = dp[i-1] + 1; //新添加字符为结尾不能匹配的情况
for(String s : dictionary){
if(s.length() <= i) //当前长度 要比 待匹配的字符串长度摇长才需要匹配。
if(s.equals(sentence.substring(i - s.length(),i)))
dp[i] = Math.min(dp[i],dp[i - s.length()]);
}
}
return dp[len];
}
}
给跪了,菜还是我菜。