再谈type ahead 问题

问题:给定一个词典,包括一些词和其出现的频率。实现type ahead功能,要求用户每键入一个字符,下拉框显示以当前输入为前缀的前10个最热门的词


解法1:用不带data的Trie,(data仅仅是词频)实时查询法,需要实时的去build hot list

框架就是Triie的 startWithPrefix 查询,不同的是并不是返回遍历得到的所有词,而是像经典求top k那样,用一个大小为k的最小堆过滤。

struct TrieNode {
	int data;
	TrieNode *next[256];
};
TrieNode* put(TrieNode* x, string word, int i, int data) {
	if (x == nullptr) x = new TrieNode();
	if (i == word.size()) { x->data = data; return x; }
	x->next[word[i]] = put(x->next[word[i]], word, i + 1, data);
	return x;
}
TrieNode * buildTrie(map<string, int> &dict) {
	TrieNode* root = new TrieNode();
	for (auto & entry : dict) {
		put(root, entry.first, 0, entry.second);
	}
	return root;
}
class TypeAhead {
private:
	stack<TrieNode*> path;
	string prefix;
	stack<vector<string>> cache;
	typedef pair<int, string> P;
	void collect(TrieNode *x, string prefix, priority_queue<P, vector<P>, greater<P>> &pq) {
		if (x == nullptr) return;
		if (x->data > 0) {//is key
			pq.push(make_pair(x->data, prefix));
			if (pq.size() > 10) pq.pop();
		}
		for (char c = 0; c < 256; ++c)
			collect(x->next[c], prefix + c, pq);
	}
public:
	TypeAhead(TrieNode* root) { path.push(root); }
	vector<string> type(char c) {
		prefix.push_back(c);
		if (path.top() != nullptr) path.push(path.top()->next[c]);
		else path.push(nullptr);

		if (path.top() == nullptr) {
			cache.push({});
			return {};
		}
		priority_queue<P, vector<P>, greater<P>> pq;
		collect(path.top(), prefix, pq);
		vector<string> dropList;
		for (; pq.size() > 0; pq.pop()) { dropList.push_back(pq.top().second); }
		cache.push(dropList);
		return dropList;
	}
	vector<string> back() {
		if (path.size() == 1) return{};
		path.pop();
		prefix.pop_back();
		cache.pop();
		return cache.top();
	}
};



解法2: 用 带data的 Trie,data就是该前缀下 最热的十个词,查询时候直接返回hot list

build trie 有所不同,遍历词典,把每个词所有前缀对应的节点都link到该词,每个节点的拉链就是一个大小为k的最小堆,


解法3: 还是用带data的 trie,词典预先按词频降序排列,然后按顺序插入Trie,也是把词加入到其每个前缀节点的拉链,拉链大小超过10后就不插了,



第一种方法,build trie时候就是传统的build trie, 查询相对复杂

第二三种方法,是invert index,定位到key后,直接返回数据就行 (top 10 拉链)


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值