Google 面试题 | 字典里面的最长单词

最新推荐文章于 2020-03-09 12:17:47 发布

njit_peiyuan

最新推荐文章于 2020-03-09 12:17:47 发布

阅读量119

点赞数

文章标签：面试数据结构与算法

原文链接：https://juejin.im/post/5a79be586fb9a063435ebe95

版权

专栏 | 九章算法

网址 | http://www.jiuzhang.com

三角形分割线

给定一个字符串列表words，找到words最长的word，使得这个word可用words中的其他word一次一个字符地构建。如果有多个可选答案，则返回最长的且具有最小字典序的word。

Ⅰ

Input:words = ["w","wo","wor","worl", "world"]

Output: "world"

Explanation:“world”可通过”w”, “wo”, “wor”, “worl”一次一个字符进行构建。
复制代码

Ⅱ

Input:words = ["a", "banana", "app", "appl", "ap", "apply", "apple"]

Output:"apple"

Explanation:“apply”和”apple”都可以由其他字符构建。但”apple”的字典序要小于”apply”。
复制代码

注意：

所有的输入字符只包含小写字符。

words的长度在[1, 1000]范围内。

words[i]的长度在[1, 30]范围内。

方法一：直接采用暴力搜索。

对于每一个word，检查是否其前缀都在words中。可以用words构建set。初始化ans=””，words，对每个元素，在set中寻找是否有其所有前缀。如果当前word合题，且长度大于ans，或长度等于ans但字典序小于ans，则修改ans为当前word。也可以先对words排序，按照长度从小到大，长度相同按照字典顺序。这样只要word合题就修改ans。

时间复杂度：O(sum(w_i^2)),w_i表示words[i]的长度。对于每一个word，通过哈希表检查是否所有的前缀都在set当中需要O(w_i^2)。

空间复杂度：O(sum(w_i))用于创建set。

方法二：因为涉及到了字符串的前缀，所以使用Trie结构（一种字符串前缀树）。

先介绍Trie，如果已经了解Trie树可跳过这部分：

Trie，又称单词查找树或键树，是一种树形结构。典型应用是用于统计和排序大量的字符串（但不仅限于字符串），所以经常被搜索引擎系统用于文本词频统计。它的优点是：最大限度地减少无谓的字符串比较，查询效率比哈希表高。

它有3个基本性质：

1.根节点不包含字符，除根节点外每一个节点都只包含一个字符。

2.从根节点到某一节点，路径上经过的字符连接起来，为该节点对应的字符串。

3.每个节点的所有子节点包含的字符都不相同。

Trie中每个节点有一个特殊标记作为结束符号，通过该标记可以判断当前节点是否是一个字符串的终结节点。

下图是一个Trie树的例子，记录了to,tea,ted,ten,a,i,in,inn这些words（以蓝色结尾）。

把每个word放入Trie中，对Trie进行DFS，只搜索终结节点。每个找到的节点中（除了根）从根到该节点路径代表该节点的word。之后同方法一：如果当前word合题，且长度大于ans，或长度等于ans但字典序小于ans，则修改ans为当前word。

时间复杂度：O(sum(w_i))，w_i是words[i]的长度。这是构建和便利Trie的复杂度。如果使用BFS而不是DFS，并且把每个节点的子节点进行排序，那么我们就不需要再去检查当前的word时候比ans要好，后访问的节点一定要好于先访问的节点，但复杂度不变。

空间复杂度：O(sum(w_i))用于构建Trie。

http://www.jiuzhang.com/solution/longest-word-in-dictionary/

本题是一道中等难度的题目，主要考察了Hash表和Trie这两种数据结构，可以区分几类面试者。对于想到Hash表来实现方法一的面试者可以给出hire；对于会用Trie树实现方法二的面试者给出strong hire。

http://www.lintcode.com/en/problem/longest-words/

http://www.lintcode.com/problem/implement-trie/

分割线

欢迎关注我的微信公众号：九章算法（ninechapter）。
精英程序员交流社区，定期发布面试题、面试技巧、求职信息等

njit_peiyuan

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Google 面试题 | 字典里面的最长单词

专栏 | 九章算法网址 | http://www.jiuzhang.com三角形分割线给定一个字符串列表words，找到words最长的word，使得这个word可用words中的其他word一次一个字符地构建。如果有多个可选答案，则返回最长的且具有最小字典序的word。ⅠInput:words = ["w","wo","wor","worl", "world"]Outp...
复制链接

扫一扫