恢复空格
哦,不!你不小心把一个长篇文章中的空格、标点都删掉了,并且大写也弄成了小写。像句子"I reset the computer. It still didn’t boot!“已经变成了"iresetthecomputeritstilldidntboot”。在处理标点符号和大小写之前,你得先把它断成词语。当然了,你有一本厚厚的词典dictionary,不过,有些词没在词典里。假设文章用sentence表示,设计一个算法,把文章断开,要求未识别的字符最少,返回未识别的字符数。
解题思路
动态规划
1、通过创建于待判定字符串等长的数组做标记
2、从字符串的后面往前遍历,以这个字符串为起点,分别判断dictionary中的元素是否可以与之匹配,并每次更新当前未匹配元素的最小值。如果所有的都不能匹配,就在前面的基础上加一,并继续遍历。
class Solution:
def respace(self, dictionary: List[str], sentence: str) -> int:
#首先,将dictionary遍历,求出每一个元素的长度,以为后面的遍历节约开销
d={}
for i in dictionary:
d[i]=len(i)
#创建一个做标记的数组dp
len_sentence=len(sentence)
dp=[0]*(len_sentence+1)
#进入主体部分,开始遍历
for i in range(len_sentence-1,-1,-1):
#首先,将当前元素的dp值在后一个元素的基础上加一,作为未匹配的最坏情况
dp[i]=dp[i+1]+1
#遍历字典d
for j in d:
#如果有匹配的值,就更新当前的dp元素
if sentence[i:i+d[j]]==j:
dp[i]=min(dp[i],dp[i+d[j]])
#返回结果
return dp[0]