来源:力扣(LeetCode)
描述:
设计一个包含一些单词的特殊词典,并能够通过前缀和后缀来检索单词。
实现 WordFilter
类:
WordFilter(string[] words)
使用词典中的单词words
初始化对象。f(string pref, string suff)
返回词典中具有前缀prefix
和后缀suff
的单词的下标。如果存在不止一个满足要求的下标,返回其中 最大的下标 。如果不存在这样的单词,返回-1
。
示例:
输入
["WordFilter", "f"]
[[["apple"]], ["a", "e"]]
输出
[null, 0]
解释
WordFilter wordFilter = new WordFilter(["apple"]);
wordFilter.f("a", "e"); // 返回 0 ,因为下标为 0 的单词:前缀 prefix = "a" 且 后缀 suff = "e" 。
提示:
- 1 <= words.length <= 104
- 1 <= words[i].length <= 7
- 1 <= pref.length, suff.length <= 7
- words[i]、pref 和 suff 仅由小写英文字母组成
- 最多对函数 f 执行 104 次调用
方法一:计算每个单词的前缀后缀组合可能性
思路
预先计算出每个单词的前缀后缀组合可能性,用特殊符号连接,作为键,对应的最大下标作为值保存入哈希表。检索时,同样用特殊符号连接前后缀,在哈希表中进行搜索。
代码:
class WordFilter {
private:
unordered_map<string, int> dict;
public:
WordFilter(vector<string>& words) {
for (int i = 0; i < words.size(); i++) {
int m = words[i].size();
string word = words[i];
for (int prefixLength = 1; prefixLength <= m; prefixLength++) {
for (int suffixLength = 1; suffixLength <= m; suffixLength++) {
string key = word.substr(0, prefixLength) + '#' + word.substr(m - suffixLength);
dict[key] = i;
}
}
}
}
int f(string pref, string suff) {
string target = pref + '#' + suff;
return dict.count(target) ? dict[target] : -1;
}
};
执行用时:1052 ms, 在所有 C++ 提交中击败了10.77%的用户
内存消耗:254.1 MB, 在所有 C++ 提交中击败了33.85%的用户
方法二:字典树
思路
调用 f
时,如果前缀和后缀的长度相同,那么此题可以用字典树来解决。初始化时,只需将单词正序和倒序后得到的单词对依次插入字典树即可。比如要插入 “apple"
时,只需依次插入 (‘a’, ‘e’), (‘p’, ‘l’), (‘p’, ‘p’), (‘l’, ‘p’), (‘e’, ‘a’)
即可。这样初始化后,对于前缀和后缀相同的检索,也只需要在字典树上检索前缀和后缀倒序得到的单词对。但是调用 f
时,还有可能遇到前缀和后缀长度不同的情况。为了应对这一情况,可以将短的字符串用特殊字符补足,使得前缀和后缀长度相同。而在初始化时,也需要考虑到这个情况,特殊字符组成的单词对,也要插入字典树中。
代码:
struct Trie {
unordered_map<string, Trie *> children;
int weight;
};
class WordFilter {
private:
Trie *trie;
public:
WordFilter(vector<string>& words) {
trie = new Trie();
for (int i = 0; i < words.size(); i++) {
string word = words[i];
Trie *cur = trie;
int m = word.size();
for (int j = 0; j < m; j++) {
Trie *tmp = cur;
for (int k = j; k < m; k++) {
string key({word[k], '#'});
if (!tmp->children.count(key)) {
tmp->children[key] = new Trie();
}
tmp = tmp->children[key];
tmp->weight = i;
}
tmp = cur;
for (int k = j; k < m; k++) {
string key({'#', word[m - k - 1]});
if (!tmp->children.count(key)) {
tmp->children[key] = new Trie();
}
tmp = tmp->children[key];
tmp->weight = i;
}
string key({word[j], word[m - j - 1]});
if (!cur->children.count(key)) {
cur->children[key] = new Trie();
}
cur = cur->children[key];
cur->weight = i;
}
}
}
int f(string pref, string suff) {
Trie *cur = trie;
int m = max(pref.size(), suff.size());
for (int i = 0; i < m; i++) {
char c1 = i < pref.size() ? pref[i] : '#';
char c2 = i < suff.size() ? suff[suff.size() - 1 - i] : '#';
string key({c1, c2});
if (!cur->children.count(key)) {
return -1;
}
cur = cur->children[key];
}
return cur->weight;
}
};
执行用时:1316 ms, 在所有 C++ 提交中击败了5.64%的用户
内存消耗:497 MB, 在所有 C++ 提交中击败了13.34%的用户>author:LeetCode-Solution