面试题 17.13. 恢复空格

转载自:https://leetcode-cn.com/problems/re-space-lcci/solution/python-3dong-tai-gui-hua-by-acw_jpch89-4/
原作者很6

面试题 17.13. 恢复空格
哦,不!你不小心把一个长篇文章中的空格、标点都删掉了,并且大写也弄成了小写。像句子"I reset the computer. It still didn’t boot!“已经变成了"iresetthecomputeritstilldidntboot”。在处理标点符号和大小写之前,你得先把它断成词语。当然了,你有一本厚厚的词典dictionary,不过,有些词没在词典里。假设文章用sentence表示,设计一个算法,把文章断开,要求未识别的字符最少,返回未识别的字符数。

注意:本题相对原题稍作改动,只需返回未识别的字符数

示例:
输入:
dictionary = [“looked”,“just”,“like”,“her”,“brother”]
sentence = “jesslookedjustliketimherbrother”
输出: 7
解释: 断句后为"jess looked just like tim her brother",共7个未识别字符。

提示:
0 <= len(sentence) <= 1000
dictionary中总字符数不超过 150000。
你可以认为dictionary和sentence中只包含小写字母。

class Solution:
    def respace(self, dictionary: List[str], sentence: str) -> int:
        """
        动态规划
        把状态定义为 f[i],i 的取值范围是 [0, n],其中 n 为 sentence 的长度。
        f[i] 表示前 i 个字符所有可能的划分方式中,最少的未识别字符数。

        状态转移:
            集合划分:
                第 i 个字符无法与前面任何一个子串组成单词:f[i - 1] + 1
                第 i 个字符可以与前面某个子串组成单词:f[j]
                if sentence[j:i] in dictionary,0 <= j <= i - 1
            初始化:f[0] = 0,当 sentence 为空字符串时,未识别字符数为 0
            答案:f[-1]
        """
        d = {}.fromkeys(dictionary)
        n = len(sentence)
        f = [0] * (n + 1)
        for i in range(1, n + 1):
            f[i] = f[i - 1] + 1
            for j in range(i):
                if sentence[j:i] in d:
                    # i遍历过程中可能会出现不是最小未识别字符数得情况,所以穷举,使用min(f[i], f[j])更新
                    f[i] = min(f[i], f[j])
        return f[-1]
        
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值