[英雄星球六月集训LeetCode解题日报] 第23日字典树

最新推荐文章于 2024-09-15 15:43:59 发布

七水shuliang

最新推荐文章于 2024-09-15 15:43:59 发布

阅读量140

点赞数

分类专栏：今天开刷leetcode 英雄星球六月集训文章标签： leetcode 算法

本文链接：https://blog.csdn.net/liuliangcan/article/details/125435628

版权

今天开刷leetcode 同时被 2 个专栏收录

139 篇文章 2 订阅

订阅专栏

英雄星球六月集训

37 篇文章 1 订阅

订阅专栏

[英雄星球六月集训LeetCode解题日报] 第23日字典树

日报

今天两题代码可以复用，直接字典树模板套进来，写个查询即可。

题目

一、 472. 连接词

链接: 472. 连接词

1. 题目描述

连接词

难度：困难

给你一个 不含重复 单词的字符串数组 words ，请你找出并返回 words 中的所有 连接词 。

连接词 定义为：一个完全由给定数组中的至少两个较短单词组成的字符串。

示例 1：

输入：words = ["cat","cats","catsdogcats","dog","dogcatsdog","hippopotamuses","rat","ratcatdogcat"]
输出：["catsdogcats","dogcatsdog","ratcatdogcat"]
解释："catsdogcats" 由 "cats", "dog" 和 "cats" 组成; 
     "dogcatsdog" 由 "dog", "cats" 和 "dog" 组成; 
     "ratcatdogcat" 由 "rat", "cat", "dog" 和 "cat" 组成。

示例 2：

输入：words = ["cat","dog","catdog"]
输出：["catdog"]

提示：

1 <= words.length <= 10⁴
0 <= words[i].length <= 30
words[i] 仅由小写字母组成
0 <= sum(words[i].length) <= 10⁵

2. 思路分析

先过一遍·words建立字典树。
接下来我们定义一个查询方法：find_split_count(s),这个方法的作用是用words中的单词恰好拼接s，寻找最多能把word切几段。
那么答案显然就是words中每个单词执行一遍这个函数，返回值>=2的单词就是答案。
当我们用字典树的查找方法，从s头开始匹配，寻找到一个完整单词时，从这里把s切成两半s1,s2.
显然s1在words中出现了，那么只要s2也在words中出现，那么这个s就是满足题意的字符串；s2也可本身不用出现，只需要它能用words中多个字符串拼起来即可。
显然s2可以递归这个函数本身find_split_count(s2)。
右半部分返回值r>=1，加上左半部分本身是一个合法串，l=1，那么这个串已经满足题意，可以提前返回了。
具体实现时，为了不疯狂切片，我们方法声明为find_split_count(s,start,n)，start和n代表s从下标start开始匹配到n结束。
一定注意最后返回时要判断cur.is_end，如果非结束，那说明匹配失败，返回0。

3. 代码实现

class TrieNode:
    def __init__(self,cnt=0):
        self.cnt = cnt 
        self.next = [None]*26
        self.is_end = False
    def insert(self, word: str) -> None:
        cur = self
        for c in word:
            i = ord(c)-ord('a')
            if not cur.next[i] :  # 没有这个字符
                cur.next[i] = TrieNode()
            cur = cur.next[i]
            cur.cnt += 1
        cur.is_end = True
   
    def find_split_count(self,word,start,n):   
        if start == n:
            return 0
        cur = self
        m = 0
        for i in range(start,n):
            c = word[i]
            idx = ord(c) - ord('a')
            
            if not cur.next[idx]:
                return 0
            cur = cur.next[idx]
            if cur.is_end:
                m = self.find_split_count(word,i+1,n)+1
                if m >= 2:
                    return m                
        return m if cur.is_end else 0

class Solution:
    def findAllConcatenatedWordsInADict(self, words: List[str]) -> List[str]:
        trie = TrieNode()
        n = len(words)
        for word in words:
            trie.insert(word)
        # word='nuqhmfj'
        # print(trie.find_split_count(word,0,len(word)))
        return [word for word in words if trie.find_split_count(word,0,len(word)) >=2]

二、面试题 17.15. 最长单词

链接: 面试题 17.15. 最长单词

1. 题目描述

面试题 17.15. 最长单词

难度：中等

给定一组单词words，编写一个程序，找出其中的最长单词，且该单词由这组单词中的其他单词组合而成。若有多个长度相同的结果，返回其中字典序最小的一项，若没有符合要求的单词则返回空字符串。

示例：

输入： ["cat","banana","dog","nana","walk","walker","dogwalker"]
输出： "dogwalker"
解释： "dogwalker"可由"dog"和"walker"组成。

提示：

0 <= len(words) <= 200
1 <= len(words[i]) <= 100

2. 思路分析

这题和上题字典树部分代码完全一致。
满足条件的单词判断一下长度和字典序即可。

3. 代码实现

class TrieNode:
    def __init__(self, cnt=0):
        self.cnt = cnt
        self.next = [None] * 26
        self.is_end = False

    def insert(self, word: str) -> None:
        cur = self
        for c in word:
            i = ord(c) - ord('a')
            if not cur.next[i]:  # 没有这个字符
                cur.next[i] = TrieNode()
            cur = cur.next[i]
            cur.cnt += 1
        cur.is_end = True

    def find_split_count(self, word, start, n):
        if start == n:
            return 0
        cur = self
        m = 0
        for i in range(start, n):
            idx = ord(word[i]) - ord('a')

            if not cur.next[idx]:
                return 0
            cur = cur.next[idx]
            if cur.is_end:
                m = self.find_split_count(word, i + 1, n) + 1
                if m >= 2:
                    # print(word[start:i + 1], word[i + 1:], m)
                    return m       
                    
        return m  if cur.is_end else 0
        
class Solution:
    def longestWord(self, words: List[str]) -> str:
        ans = ''
        m = 0
        trie = TrieNode()

        for word in words:
            trie.insert(word)
        for word in words:
            n = len(word)
            if trie.find_split_count(word,0,n)>=2:
                if n > m :
                    m = n
                    ans = word
                elif n == m and word < ans:
                    ans = word
        return ans