搜索引擎中suggestion背后的算法结构

搜索引擎的Suggestion功能在用户输入时能迅速提供可能的查询建议,这背后的关键是字典树(Trie树)的数据结构。通过字典树,可以实现字符串的快速检索、排序和查找最长公共前缀。Suggestion结果通常基于用户日志中的查询词关注度进行排序,并且会定期更新以保持时效性。
摘要由CSDN通过智能技术生成

我们使用某个搜索引擎的时候,往往你刚输入开头,页面就会给出一些我们极有可能想要查的内容,

例如今天想搜索玉免号内容,刚打了个玉字,下面就给出了玉兔提示(suggestion)



那么这是怎么做到的呢?


来看下百度百科对字典数据描述,我想你就知道答案了

至于有多个suggestion结果的时候如何选择的问题,可以根据某时间内用户日志中对查询词关注度排序得到

另外,这个suggestion是会及时更新的,意思是一般每天都会后台更新一次


字典树

Trie树即字典树。

又称单词查找树, Trie树,是一种 树形结构,是一种哈希树的变种。典型应用是用于统计,排序和保存大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本词频统计。它的优点是:利用字符串的公共前缀来减少查询时间,最大限度地减少无谓的字符串比较,查询效率比 哈希表高。

1性质

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值