联想词搜索(suggest)

本文介绍了搜索联想功能的应用,如百度、谷歌等搜索引擎及电商平台。提到了两种实现方式:倒排索引(如Lucene的suggest模块)和字典树(Trie树)。倒排索引适用于大型数据但性能和内存占用是问题,而Trie树则以空间换时间,适合统计、排序和保存大量字符串。文章还探讨了Trie树的插入和查询过程,以及其在字符串查询、数量统计、热搜等问题上的应用。
摘要由CSDN通过智能技术生成

1 .应用场景

现在很多应用都有搜索联想功能,baidu,google,各种电商都有这种搜索智能提示功能,可以帮助用户尽快找到自己想要的,用户是比较懒的,所有这种还是比较常见的。如下图所示用户输入 “数据结构”,联想出下面的结果以及结果数量

2.实现原理

这种联想功能有两种实现方式
2.1 倒排索引

比如说lucene的 suggest模块),这种方式可以实现,但是有点大材小用,而且性能也是问题, 主要是通过编辑距离大于某个阈值就认为联想出来的词和下面的相关,分词也是必须采用NGRAM才行,要不然用户搜索的时候会发现结果会消失。索引大和查询性能都会有影响,所以不推荐这种方式,solr&es关于suggest模块没有做什么优化,es里面目spellcheck里面默认是2-Gram方法,关于编辑距离优化的方法 推荐看 N-Gram

2.2 字典树(trie)

又称单词查找树,Trie树,是一种树形结构,是一种哈希树的变种。典型应用是用于统计,排序和保存大量的字符串(但不仅限于字符串),所以经常被搜索引擎系统用于文本词频统计。它的优点是:利用字符串的公共前缀来减少查询时间,最大限度地减少无谓的字符串比较,查询效率比哈希树高。

3. trie原理

这里举个例子吧,比如我现在有 int, at, age, and 这几个词,我现在建树

线上主要场景是用户通过拼音和汉字都能搜索到相同的结果,这里就可以把拼音通过map映射成汉字就行

插入过程

对于一个单词,从root开始,沿着单词的各个字母所对应的树中的节点分支向下走,直到单词遍历完,将最后的节点标记为绿色,表示该单词已插入trie树&
要实现一个搜索框并且带有联想功能,您可以按照以下步骤进行: 1. 搭建Java Web项目,使用Spring Boot或其他框架,搭建搜索框的前端页面和后台接口。 2. 集成Redis数据库,用于存储搜索关键联想的缓存数据。 3. 前端页面通过Ajax请求后台接口,将用户输入的关键发送到后台服务端。 4. 服务端根据用户输入的关键,从Redis缓存中查找匹配的搜索结果和联想,并将结果返回给前端页面。 5. 前端页面将搜索结果和联想展示给用户,用户可以选择点击搜索结果或者选择联想进行搜索。 下面是一个简单的示例代码: 前端页面代码(HTML/CSS/JS): ```html <div class="search-wrapper"> <input type="text" class="search-input" id="search-input" placeholder="请输入搜索关键"> <ul class="search-suggest" id="search-suggest"></ul> </div> <script> $(document).ready(function() { $("#search-input").on("input", function() { var keyword = $(this).val(); $.ajax({ url: "/search", type: "GET", data: { keyword: keyword }, success: function(data) { // 显示联想 var suggestHtml = ""; for (var i = 0; i < data.suggest.length; i++) { suggestHtml += "<li>" + data.suggest[i] + "</li>"; } $("#search-suggest").html(suggestHtml); } }); }); }); </script> ``` 后台接口代码(Java/Spring Boot): ```java @RestController public class SearchController { @Autowired private RedisTemplate<String, String> redisTemplate; @GetMapping("/search") public Map<String, Object> search(@RequestParam("keyword") String keyword) { Map<String, Object> result = new HashMap<>(); List<String> suggest = new ArrayList<>(); String key = "search:" + keyword; String value = redisTemplate.opsForValue().get(key); if (value != null) { // 如果缓存中存在搜索结果,则直接返回 result.put("result", value); } else { // 如果缓存中不存在搜索结果,则进行搜索 String searchResult = doSearch(keyword); result.put("result", searchResult); redisTemplate.opsForValue().set(key, searchResult); } // 获取联想 Set<String> keys = redisTemplate.keys("suggest:" + keyword + "*"); for (String k : keys) { suggest.add(k.replace("suggest:", "")); } result.put("suggest", suggest); return result; } private String doSearch(String keyword) { // TODO: 实现搜索逻辑 return "搜索结果"; } } ``` 上述代码仅为示例,具体实现还需要根据实际情况进行调整。
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值