前言
昨天实现了句子的搜索,并且简单的更换了分词器,优化一下查询的结果,今天准备学习一下搜索提示的实现,并且设计一下如何使用java api实现搜索提示。
Suggest的学习
在查看官方文档之后,发现ElasticSearch的Suggest总共有四种类型
文档链接:http://doc.codingdict.com/elasticsearch/123/
- Term Suggester
- Phrase Suggester
- Completion Suggester
- Context Suggester
然后我就一一了解了一下
(1)Term suggester
term 词项建议器,对给入的文本进行分词,为每个词进行模糊查询提供词项建议。对于在索引中存在词默认不提供建议词,不存在的词则根据模糊查询结果进行排序后取一定数量的建议词。
常用的建议选项:
(2)phrase suggester
phrase 短语建议,在term的基础上,会考量多个term之间的关系,比如是否同时出现在索引的原文里,相邻程度,以及词频等
(3)Completion Suggester
针对自动补全场景而设计的建议器。此场景下用户每输入一个字符的时候,就需要即时发送一次查询请求到后端查找匹配项,在用户输入速度较高的情况下对后端响应速度要求比较苛刻。因此实现上它和其他Suggester采用了不同的数据结构,索引并非通过倒排来完成,而是将analyze过的数据编码成FST和索引一起存放。对于一个open状态的索引,FST会被ES整个装载到内存里的,进行前缀查找速度极快。但是FST只能用于前缀查找,这也是Completion Suggester的局限所在。
这个是我准备重点使用的Suggester
注意:使用这个需要在被搜索的字段中设置type为completion,analyzer按情况设置分析器。才能实现自动的补全
(4)Context Suggester
好像能通过设置字段,实现上下文的映射。 有两种类型: category 和 geo 。 上下文映射在字段映射中的 contexts 参数下配置。看了半天文档没看明白,好像是能实现:设置地理位置的上下文然后进行地理映射
具体文档http://doc.codingdict.com/elasticsearch/124/
设计
通过简单的了解,感觉使用ES实现搜索框的补全/纠错功能应该以如下的方式设计:
(1)在用户刚开始输入的过程中,使用Completion Suggester进行关键词前缀匹配,刚开始匹配项会比较多,随着用户输入字符增多,匹配项越来越少。如果用户输入比较精准,可能Completion Suggester的结果已经够好,用户已经可以看到理想的备选项了。
(2)如果Completion Suggester已经到了零匹配,那么可以猜测是否用户有输入错误,这时候可以尝试一下Phrase Suggester。
(3)如果Phrase Suggester没有找到任何option,开始尝试term Suggester。
最后一个Context Suggester,还是不知道该怎么用。。。。。
Completion Suggester的尝试
了解到如果使用 Completion Suggester的话,需要在建立索引的时候,设置field重的suggest的type和analyzer,所以打算找一个demo先学习一下。
参考链接:https://zq99299.github.io/note-book/elasticsearch-senior/es-high/76-completion-suggest.html#什么是-completion-suggest-?
(1)新建索引
PUT /news_website
{
"mappings": {
"news" : {
"properties" : {
"title" : {
"type": "text",
"analyzer": "ik_max_word",
"fields": {
"suggest" : {
"type" : "completion",
"analyzer": "ik_max_word"
}
}
},
"content": {
"type": "text",
"analyzer": "ik_max_word"
}
}
}
}
}
发现关键的配置是:
有了这个才能实现自动补全
(2)插入测试数据
PUT /news_website/news/1
{
"title": "大话西游电影",
"content": "大话西游的电影时隔20年即将在2017年4月重映"
}
PUT /news_website/news/2
{
"title": "大话西游小说",
"content": "某知名网络小说作家已经完成了大话西游同名小说的出版"
}
PUT /news_website/news/3
{
"title": "大话西游手游",
"content": "网易游戏近日出品了大话西游经典IP的手游,正在火爆内测中"
}
(3)尝试进行搜索
GET /news_website/news/_search
{
"suggest": {
"my-suggest" : {
"prefix" : "大话西游",
"completion" : {
"field" : "title.suggest"
}
}
}
}
注意到结果自动匹配到了三条数据
并且发现搜索的field也有讲究:
总结
在学习了Suggester之后,我发现自己需要重新按Completion Suggester的要求建立索引,最终才能实现搜索提示。