elasticsearch suggest 的几种使用-completion 的基本 使用

我们再使用solr时,可以用spellchecker进行搜索时建议。在elasticsearch中我们使用SuggestionBuilder进行拼写建议。
1.使用TermSuggestionBuilder

TermSuggestionBuilder suggest=new TermSuggestionBuilder("my-suggest-1");
            suggest.analyzer("ik").field("content").size(n).text(q).maxTermFreq(10).minDocFreq(0).suggestMode("always");
            Client client = ESServiceSingleton2.getTransportClient();
            SearchResponse response = client.prepareSearch("cms")
            .setTypes("news").setSearchType(SearchType.COUNT)
            .setSuggestText(q)
            .addSuggestion(suggest)
            .execute().actionGet();
            Suggest suggest=response.getSuggest();
List<? extends Entry<? extends Option>>  list=suggest.getSuggestion("simple").getEntries();
            for(int i=0; i<list.size();i++){
 
            List<?> options=list.get(i).getOptions();
            for(int j=0;j<options.size();j++){
            if(options.get(j) instanceof Option){
            Option op=(Option)options.get(j);
            System.out.println(op.getScore());
            System.out.println(op.getText());
 
            }
 
            }
            System.out.println(list.get(i).getText());
            }

1.使用PhraseSuggestionBuilder


//q为查询词
//n为返回建议词条长度
Suggest suggest = searchSuggest(client, q,
                        phraseSuggestion("simple").maxErrors(0.5f).field("content").analyzer("ik")
                          .addCandidateGenerator(PhraseSuggestionBuilder.candidateGenerator("content").minWordLength(1).suggestMode("always"))
                                .size(n));
 
   SearchResponse response = client.prepareSearch("cms")
            .setTypes("news").setSearchType(SearchType.COUNT)
            .setSuggestText(q)
            .addSuggestion(suggest)
            .execute().actionGet();
            Suggest suggest=response.getSuggest();
List<? extends Entry<? extends Option>>  list=suggest.getSuggestion("simple").getEntries();
            for(int i=0; i<list.size();i++){
 
            List<?> options=list.get(i).getOptions();
            for(int j=0;j<options.size();j++){
            if(options.get(j) instanceof Option){
            Option op=(Option)options.get(j);
            System.out.println(op.getScore());
            System.out.println(op.getText());
 
            }
 
            }
            System.out.println(list.get(i).getText());
            }



在lucene里面,suggest 的支持非常完善,可以随心所欲的定制; 但是在es中使用起来就没有那么方便了。 es给suggest 分类4类:term ;phrase; completion; context; 目前最新版本是es1.2.1 这一块也还在不断完善中; term suggester 是根据某词元在制定的字段中出现的频次来做出提示; phrase suggester 是给term 上做了加强; 这里不做使用方法介绍;

链接地址:http://www.elasticsearch.org/guide/en/elasticsearch/reference/current/search-suggesters-term.html

剩下的是completion 、context suggester。 这两个的使用与上面个使用方法完全不一样,上面都在查询的时候根据制定字段内容来做提示,而这两种是需要在mapping 里面定制suggester字段。使用时完全匹配时提示;

completion suggester 官方文档 http://www.elasticsearch.org/guide/en/elasticsearch/reference/current/search-suggesters-completion.html 文档讲解的非常全面,遗憾的是没有代码,这里把代码加上java client;

1:设置mapping 中的suggester

@Test 
public void createQucikIndecs() throws IOException{ 
XContentBuilder mapping = XContentFactory.jsonBuilder() 
.startObject() 
.startObject("pingzhuang") 
.startObject("properties") 
.startObject("id").field("type", "long").field("store", "yes").field("index", "not_analyzed").endObject() 
.startObject("name").field("type", "string").field("store", "no").field("indexAnalyzer", "ik").field("searchAnalyzer", "ik").endObject() 
.startObject("suggest").field("type","completion").field("index_analyzer","simple").field("search_analyzer","simple").field("payloads","true").endObject() 
.endObject() 
.endObject() 
.endObject(); 
ESHandler.createQuickIndices("chinamedic", "pingzhuang", mapping, "formedic"); 
}

2: 设置好了以后,在做索引的时候每次都应该添加提示

@Test 
public void addIndex(){ 
String json="{\"id\":44,\"name\":\"老狼-白衣飘飘的年代\",\"suggest\":{\"input\":\"老狼-白衣飘飘的年代\"}}"; 
String json1="{\"id\":42,\"name\":\"老狼-郎心似铁\",\"suggest\":{\"input\":\"老狼-郎心似铁\"}}"; 
String json2="{\"id\":43,\"name\":\"老狼-流浪歌手的请人\",\"suggest\":{\"input\":\"老狼-流浪歌手的请人\"}}"; 
ESHandler.addOneIndex("chinamedic","pingzhuang", json); 
ESHandler.addOneIndex("chinamedic","pingzhuang", json1); 
ESHandler.addOneIndex("chinamedic","pingzhuang", json2); 
System.out.println(); 
}

3: 然后就是查询获得提示了

/** 
* 搜索建议,自动补全搜索结结果 
* @param indices 索引库名称 
* @param prefix 搜索前缀词 
* @return 建议列表 
*/ 
public static List<String> getCompletionSuggest(String indices, 
String prefix) { 
CompletionSuggestionBuilder suggestionsBuilder = new CompletionSuggestionBuilder( 
"complete"); 
suggestionsBuilder.text(prefix); 
suggestionsBuilder.field("suggest"); 
suggestionsBuilder.size(10); 
SuggestResponse resp = client.prepareSuggest(indices) 
.addSuggestion(suggestionsBuilder).execute().actionGet(); 
List<? extends Entry<? extends Option>> list = resp.getSuggest() 
.getSuggestion("complete").getEntries(); 
List<String> suggests = new ArrayList<String>(); 
if (list == null) { 
return null; 
} else { 
for (Entry<? extends Option> e : list) { 
for (Option option : e) { 
suggests.add(option.getText().toString()); 
} 
} 
return suggests; 
} 
}

ok,到这里一个简单的completion suggester 就完成了。

后续再添加更多高级的使用示例。

经过测试,发现效果不是很好。建议大家使用elasticsearch-suggest-plugin


  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
Elasticsearch中,查询词提示(suggestion)功能是通过使用称为“Suggesters”(建议器)的功能来实现的。当启用查询词提示时,Elasticsearch会在内存中维护一个特定的数据结构来支持快速的建议查询。 内存的使用情况主要取决于以下几个因素: 1. 索引大小:索引的大小会直接影响内存的使用情况。如果索引很大,那么建议器需要维护更多的数据结构来支持查询词提示,从而占用更多的内存。 2. 建议器类型:Elasticsearch提供了多种类型的建议器,如term、phrase、completion等。不同类型的建议器会使用不同的数据结构和算法,从而对内存的使用情况产生影响。 3. 数据分布:建议器需要根据数据分布来构建相关的数据结构。如果数据分布不均匀,可能需要更多的内存来存储相关信息。 为了控制内存的使用情况,可以考虑以下几个方面: 1. 硬件资源:确保Elasticsearch集群具有足够的内存资源,以满足建议器所需的内存需求。根据索引大小和查询负载,调整集群的硬件配置,以确保充足的内存可用性。 2. 索引优化:通过调整索引的分片和副本设置,以及优化查询性能,减少对内存的压力。 3. 控制建议器的参数:Elasticsearch提供了一些参数来控制建议器的行为,如size、sort等。根据实际需求,调整这些参数以控制返回结果的数量和排序方式。 4. 监控和优化:定期监控集群的内存使用情况,并根据需要进行优化。可以使用Elasticsearch提供的监控工具和API,如Elasticsearch集群健康API、节点状态API等。 总的来说,内存的使用情况会受到多个因素的影响,包括索引大小、建议器类型和数据分布等。通过合理配置硬件资源、优化索引和建议器参数,并进行监控和优化,可以控制和优化Elasticsearch中查询词提示功能的内存使用情况。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值