题目为 哦,不!你不小心把一个长篇文章中的空格、标点都删掉了,并且大写也弄成了小写。像句子"I reset the computer. It still didn’t boot!“已经变成了"iresetthecomputeritstilldidntboot”。在处理标点符号和大小写之前,你得先把它断成词语。当然了,你有一本厚厚的词典dictionary,不过,有些词没在词典里。假设文章用sentence表示,设计一个算法,把文章断开,要求未识别的字符最少,返回未识别的字符数。
注意:本题相对原题稍作改动,只需返回未识别的字符数
这题看了题解,动态规划。题解思路为,用一个数组存储前 i 个字符位置的最少的未识别的字符数量。每到达一个位置,遍历字典,判断该位置向前截取能否和字典值匹配。如果匹配,从以下两个选择最小的设置为该位置值
1、该位置前一个位置的未识别字符数+1
2、向前截取匹配后,截取完数组最前端位置最少的未识别的字符数量。
public int Respace(string[] dictionary, string sentence)
{
int n = sentence.Length;
//考虑前 i 个字符最少的未识别的字符数量 dp[i]表示到i个字符时最少的未识别的字符数量。
int[] dp = new int[n + 1];
dp[0] = 0;
for (int i = 0; i < n; ++i)
{
dp[i + 1] = dp[i] + 1;
foreach (string word in dictionary)
{
if (word.Length <= i + 1)
{
if (sentence.Substring(i + 1 - word.Length, word.Length) == word)
dp[i + 1] = Math.Min(dp[i + 1], dp[i + 1 - word.Length]);
}
}
}
return dp[n];
}