今年新入职一家电商企业,公司要求我对现有系统的搜索功能进行优化;我因为在之前的公司已经有过ELK的日志系统落地经验,同时对ElasticSearch的搜索引擎实现原理也有研究,帮助公司在物联网领域实现过搜索功能,因此最近一段时间在对现有公司系统架构有一定了解后就着手搭建环境并对现有搜索功能进行改造。经过半个月的开发测试,现在搜索功能已正式上线使用,中间遇到不少问题,特地写这篇文章做个记录。
1、搜索精度问题;
matchPhrase\matchPhrasePrefix 和match的使用;must和filter的区别使用;SortBuilder.ScoreSort的使用,搜索结果按得分高低排列;
matchPhrase 或 matchPhrasePrefix 不会对输入的关键字进行分词,适合精准搜索,符合大多数业务场景,而match 会对关键字进行分词,搜索到的结果不一定符合意图,但可以搜索到的数据较多, 在实际应用中 我将两者结合使用,在精确查找没有结果时再使用match。must 相当于 按位与中的and,filter与之相似,但后者不参与评分。
SortBuilder.ScoreSort可以实现对match搜索的结果按评分高低进行排序,会按_score这个字段的得分排序。
使用from size翻页时,对from的理解:from是偏移量而非页码;这里笔者又犯了先入为主的毛病,自以为是地认为from就是页数