问题:给定一个词典,包括一些词和其出现的频率。实现type ahead功能,要求用户每键入一个字符,下拉框显示以当前输入为前缀的前10个最热门的词
解法1:用不带data的Trie,(data仅仅是词频)实时查询法,需要实时的去build hot list
框架就是Triie的 startWithPrefix 查询,不同的是并不是返回遍历得到的所有词,而是像经典求top k那样,用一个大小为k的最小堆过滤。
struct TrieNode {
int data;
TrieNode *next[256];
};
TrieNode* put(TrieNode* x, string word, int i, int data) {
if (x == nullptr) x = new TrieNode();
if (i == word.size()) { x->data = data; return x; }
x->next[word[i]] = put(x->next[word[i]], word, i + 1, data);
return x;
}
TrieNode * buildTrie(map<string, int> &dict) {
TrieNode* root = new TrieNode();
for (auto & entry : dict) {
put(root, entry.first, 0, entry.second);
}
return root;
}
class TypeAhead {
private:
stack<TrieNode*> path;
string prefix;
stack<vector<string>> cache;
typedef pair<int, string> P;
void collect(TrieNode *x, string prefix, priority_queue<P, vector<P>, greater<P>> &pq) {
if (x == nullptr) return;
if (x->data > 0) {//is key
pq.push(make_pair(x->data, prefix));
if (pq.size() > 10) pq.pop();
}
for (char c = 0; c < 256; ++c)
collect(x->next[c], prefix + c, pq);
}
public:
TypeAhead(TrieNode* root) { path.push(root); }
vector<string> type(char c) {
prefix.push_back(c);
if (path.top() != nullptr) path.push(path.top()->next[c]);
else path.push(nullptr);
if (path.top() == nullptr) {
cache.push({});
return {};
}
priority_queue<P, vector<P>, greater<P>> pq;
collect(path.top(), prefix, pq);
vector<string> dropList;
for (; pq.size() > 0; pq.pop()) { dropList.push_back(pq.top().second); }
cache.push(dropList);
return dropList;
}
vector<string> back() {
if (path.size() == 1) return{};
path.pop();
prefix.pop_back();
cache.pop();
return cache.top();
}
};
解法2: 用 带data的 Trie,data就是该前缀下 最热的十个词,查询时候直接返回hot list
build trie 有所不同,遍历词典,把每个词所有前缀对应的节点都link到该词,每个节点的拉链就是一个大小为k的最小堆,
解法3: 还是用带data的 trie,词典预先按词频降序排列,然后按顺序插入Trie,也是把词加入到其每个前缀节点的拉链,拉链大小超过10后就不插了,
第一种方法,build trie时候就是传统的build trie, 查询相对复杂
第二三种方法,是invert index,定位到key后,直接返回数据就行 (top 10 拉链)