leetcode-面试题 17.13. 恢复空格

题目

哦,不!你不小心把一个长篇文章中的空格、标点都删掉了,并且大写也弄成了小写。像句子"I reset the computer. It still didn’t boot!“已经变成了"iresetthecomputeritstilldidntboot”。在处理标点符号和大小写之前,你得先把它断成词语。当然了,你有一本厚厚的词典dictionary,不过,有些词没在词典里。假设文章用sentence表示,设计一个算法,把文章断开,要求未识别的字符最少,返回未识别的字符数。

注意:本题相对原题稍作改动,只需返回未识别的字符数

示例:

输入:
dictionary = ["looked","just","like","her","brother"]
sentence = "jesslookedjustliketimherbrother"
输出: 7
解释: 断句后为"jess looked just like tim her brother",共7个未识别字符。

提示:

0 <= len(sentence) <= 1000
dictionary中总字符数不超过 150000。
你可以认为dictionary和sentence中只包含小写字母。

解题思路

没有思路。。。看了提示可以使用递归

递归版本:
按照dictionary中所有的字符,在sentence中找到字符出现的第一个下标,然后对去掉这个字符的sentence迭代
时间复杂度应该是 o ( n s e n t e n c e ∗ n d i c t i o n a r y = 1 0 8 ) o(n_{sentence} * n_{dictionary} = 10^8) o(nsentencendictionary=108),超时了

看了题解的dp版:
用dp[i]表示第i位之前的sentence中未识别的字符,则:

  1. 如果当前第i位和之前的字符,能组成在字典中的子串,则dp[i] = dp[j],其中j是能和当前第i位组成子串的前面的字符下标。需要考虑也许能组成多个在字典中的子串,这时就需要找最小的dp[j]
  2. 如果当前第i位的字符,和之前的任何子串都组不成在字典中的子串,则dp[i] = dp[i - 1] + 1

时间复杂度是 o ( n s e n t e n c e 2 = 1 0 6 ) o(n_{sentence}^2 = 10^6) o(nsentence2=106)

dp + Trie树版:
观察dp中发现,大头的时间都在找当前i位之前的子串,是否存在于字典中了,这里可以用Trie树来加速

速度明显快了不少,dp版是8436 ms,加了trie树就变成3592 ms了

代码

递归版(未AC):

class Solution:
    def respace(self, dictionary: List[str], sentence: str) -> int:
        value_index = {}
        for word in dictionary:
            if sentence.find(word) != -1:
                value_index[word] = sentence.find(word)
        if not value_index:
            return len(sentence)
        min_mising = len(sentence)
        for word, index in value_index.items():
            min_mising = min(min_mising, self.respace(dictionary, sentence[:index] + sentence[index + len(word):]))
        return min_mising

dp版:

class Solution:
    def respace(self, dictionary: List[str], sentence: str) -> int:
        dp = [0] + [index+1 for index in range(len(sentence))]
        for index in range(len(sentence)):
            for begin_index in range(index, -1, -1):
                if sentence[begin_index: index + 1] in dictionary:
                    dp[index + 1] = min(dp[index + 1], dp[begin_index])
            dp[index + 1] = min(dp[index + 1], dp[index] + 1)
        return dp[-1]

dp + trie树:

class TrieNode:
    def __init__(self):
        self.node_dict = {}
        self.end_flag = False

class TrieTree:
    def __init__(self, dictionary: dict):
        self.root = TrieNode()
        for word in dictionary:
            node = self.root
            for each_char in word:
                if each_char not in node.node_dict:
                    node.node_dict[each_char] = TrieNode()
                node = node.node_dict[each_char]
            node.end_flag = True

    def search(self, word: str) -> bool:
        node = self.root
        for each_char in word:
            if each_char not in node.node_dict:
                return False
            node = node.node_dict[each_char]
        return node.end_flag                

class Solution:
    def respace(self, dictionary: List[str], sentence: str) -> int:
        trie = TrieTree(dictionary)
        dp = [0] + [index+1 for index in range(len(sentence))]
        for index in range(len(sentence)):
            for begin_index in range(index, -1, -1):
                # if sentence[begin_index: index + 1] in dictionary:
                if trie.search(sentence[begin_index: index + 1]):                
                    dp[index + 1] = min(dp[index + 1], dp[begin_index])
            dp[index + 1] = min(dp[index + 1], dp[index] + 1)
        return dp[-1]
### 回答1: 好的,我来用中文回复这个链接:https://leetcode-cn.com/tag/dynamic-programming/ 这个链接是 LeetCode 上关于动态规划的题目集合。动态规划是一种常用的算法思想,可以用来解决很多实际问题,比如最长公共子序列、背包问题、最短路径等等。在 LeetCode 上,动态规划也是一个非常重要的题型,很多题目都需要用到动态规划的思想来解决。 这个链接里包含了很多关于动态规划的题目,按照难度从简单到困难排列。每个题目都有详细的题目描述、输入输出样例、题目解析和代码实现等内容,非常适合想要学习动态规划算法的人来练习和提高自己的能力。 总之,这个链接是一个非常好的学习动态规划算法的资源,建议大家多多利用。 ### 回答2: 动态规划是一种算法思想,通常用于优化具有重叠子问题和最优子结构性质的问题。由于其成熟的数学理论和强大的实用效果,动态规划在计算机科学、数学、经济学、管理学等领域均有重要应用。 在计算机科学领域,动态规划常用于解决最优化问题,如背包问题、图像处理、语音识别、自然语言处理等。同时,在计算机网络和分布式系统中,动态规划也广泛应用于各种优化算法中,如链路优化、路由算法、网络流量控制等。 对于算法领域的程序员而言,动态规划是一种必要的技能和知识点。在LeetCode这样的程序员平台上,题目分类和标签设置十分细致和方便,方便程序员查找并深入学习不同类型的算法。 LeetCode的动态规划标签下的题目涵盖了各种难度级别和场景的问题。从简单的斐波那契数列、迷宫问题到可以用于实际应用的背包问题、最长公共子序列等,难度不断递进且话题丰富,有助于开发人员掌握动态规划的实际应用技能和抽象思维模式。 因此,深入LeetCode动态规划分类下的题目学习和练习,对于程序员的职业发展和技能提升有着重要的意义。 ### 回答3: 动态规划是一种常见的算法思想,它通过将问题拆分成子问题的方式进行求解。在LeetCode中,动态规划标签涵盖了众多经典和优美的算法问题,例如斐波那契数列、矩阵链乘法、背包问题等。 动态规划的核心思想是“记忆化搜索”,即将中间状态保存下来,避免重复计算。通常情况下,我们会使用一张二维表来记录状态转移过程中的中间值,例如动态规划求解斐波那契数列问题时,就可以定义一个二维数组f[i][j],代表第i项斐波那契数列中,第j个元素的值。 在LeetCode中,动态规划标签下有众多难度不同的问题。例如,经典的“爬楼梯”问题,要求我们计算到n级楼梯的方案数。这个问题的解法非常简单,只需要维护一个长度为n的数组,记录到达每一级楼梯的方案数即可。类似的问题还有“零钱兑换”、“乘积最大子数组”、“通配符匹配”等,它们都采用了类似的动态规划思想,通过拆分问题、保存中间状态来求解问题。 需要注意的是,动态规划算法并不是万能的,它虽然可以处理众多经典问题,但在某些场景下并不适用。例如,某些问题的状态转移过程比较复杂,或者状态转移方程中存在多个参数,这些情况下使用动态规划算法可能会变得比较麻烦。此外,动态规划算法也存在一些常见误区,例如错用贪心思想、未考虑边界情况等。 总之,掌握动态规划算法对于LeetCode的学习和解题都非常重要。除了刷题以外,我们还可以通过阅读经典的动态规划书籍,例如《算法竞赛进阶指南》、《算法与数据结构基础》等,来深入理解这种算法思想。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值