链接
https://leetcode-cn.com/problems/re-space-lcci/
耗时
解题:1 h 22 min
题解:14 min
题意
哦,不!你不小心把一个长篇文章中的空格、标点都删掉了,并且大写也弄成了小写。像句子"I reset the computer. It still didn’t boot!“已经变成了"iresetthecomputeritstilldidntboot”。在处理标点符号和大小写之前,你得先把它断成词语。当然了,你有一本厚厚的词典dictionary,不过,有些词没在词典里。假设文章用sentence表示,设计一个算法,把文章断开,要求未识别的字符最少,返回未识别的字符数。
思路
dp[i] 表示 sentence[0:i] 中未识别的最少字符数。对于 sentence 中每个字符,以这个字符开头的字典中的单词如果可以匹配,则更新 dp[i+now_dict_word_len-1] 为 min(dp[i+now_dict_word_len-1], dp[i-1]),即识别这个单词,如果识别这个单词可以使得未识别的字符更少的话。
细节:初始化时,将 dp[i] 置为 i,代表未识别单词时,未识别的最少字符数即为字符的数量。每次更新字符 sentence[i] 时,不要忘记更新 dp[i] 自身 dp[i] = min(dp[i], dp[i-1]+1)
,否则更新的数值不会传下去。
AC代码
class Solution {
public:
int respace(vector<string>& dictionary, string sentence) {
vector<vector<string>> dict_le(26);
for(int i = 0; i < dictionary.size(); ++i) {
dict_le[dictionary[i][0]-'a'].push_back(dictionary[i]);
}
vector<int> dp(sentence.size()+1);
for(int i = 0; i <= sentence.size(); ++i) {
dp[i] = i;
}
for(int i = 1; i <= sentence.size(); ++i) {
int now_le = sentence[i-1]-'a';
for(int j = 0; j < dict_le[now_le].size(); ++j) {
int now_dict_word_len = dict_le[now_le][j].size();
if(i-1+now_dict_word_len <= sentence.size()) {
if(dict_le[now_le][j] == sentence.substr(i-1, now_dict_word_len)) {
dp[i+now_dict_word_len-1] = min(dp[i+now_dict_word_len-1], dp[i-1]);
}
}
}
dp[i] = min(dp[i], dp[i-1]+1);
}
return dp[sentence.size()];
}
};