搜索提示是如何实现的

经典的想法就是一个Trie的 keysWithPrefix 问题。

更高级的,进一步考察,keysWithPrefix需要做prefix下的inOrder遍历,但是每当用户type下一个字符,那个提示列表瞬间就显示出来了,不像是遍历很大一棵树,除非保证这棵trie不是很大,比如只是到了一定popular程度的词才才放进来,这是一个办法。


还有一个思路,就是倒排索引的思想,用户输入的所有搜索词(一般就是一个短语)也可以看作是一个doc集合,可以为这个doc集合建立倒排,只是一般的倒排是WordId -> DocId也就是doc包含的word指向doc的索引,对于搜索词doc,它包含的word的意义可以扩展,除了一般意义的包含的词,再加上所有的前缀,后缀。比如 搜索词 crack the code interview,所有的前缀指向它,所有的后缀指向它(键入code interview, interview也可以列出它),甚至只键入code也可以列出它,这个就是看你给这个短语添加怎样的link 了。

之前方法的trie是不用数据的,类似一个set。倒排的思路trie是一个symbol table,是有数据的,数据就是这个key可以指向的phrase列表。

索引就是一个symbol table,更本质的,索引就是一个link,就是一个为记录添加什么样的link的问题,从不同字段(dimension)的角度,确定了dimension又可以有不同match的方式,full match, prefix match,还是any word match.




  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值