1.业务背景:首先搜索的内容要首先完全匹配知识分类,并且按关键字、摘要、其他字段权重依次减低进行查询结果按得分从高到低,并对各个知识分类的查询文档数进行统计
难点:因为每个文档所涉及到的知识分类可能是多个,所以统计的时候,用分类的keyword属性类型进行聚合查询就是不可能实现的
2.首先看一下mapping结构
知识分类属性:File_Clid ,知识关键字 :File_KeyWord ,知识摘要:File_Abstract
首先:要对知识分类File_Clid这个用于聚合的属性,进行分词测试,fielddata:true表示text类型的字段默认禁用开启,如果要对这个字段进行聚合和排序等操作时要开启,加载所对应的的字段的postlist到内存堆中以便进行聚合和排序
因为File_Clid的值可能是多个知识分类所以keyword肯定就排除掉了,然后测试ik_max_word(不合适)
ik_smart分词测试(合适)
standard分词测试(合适)
所以对知识分类File_Clid所用分词器用ik_smart或者standard
3.kibana查询
4.上代码
4.1构建聚合查询条件 @Override protected AggregationBuilder buildAggs(JSONObject jsonObject) { TermsAggregationBuilder field = AggregationBuilders.terms("知识分类").field("File_Clid"); return field; } 4.2构建按权重查询的条件 @Override protected QueryBuilder buildQuery(JSONObject jsonObject) { BoolQueryBuilder bool = QueryBuilders.boolQuery(); Object file_clid = jsonObject.get("File_Clid"); Object content = jsonObject.get("content"); if(ObjectUtils.isNotEmpty(file_clid))//分类不为空 bool.must(QueryBuilders.matchQuery("File_Clid", file_clid.toString()).operator(Operator.AND)); if(ObjectUtils.isNotEmpty(content)){//查询内容不为空按关键字、摘要、其他属性权重 QueryStringQueryBuilder queryStringQueryBuilder = QueryBuilders.queryStringQuery(content.toString()); Map<String,Float> boost = new HashMap<>(); boost.put("File_KeyWord",5.0f);//关键字 boost.put("File_Abstract",2.0f);//摘要 boost.put("File_Title",1.0f); boost.put("File_Fun",1.0f); boost.put("File_Structure",1.0f); boost.put("Principle",1.0f); queryStringQueryBuilder.fields(boost); bool.must(queryStringQueryBuilder.defaultOperator(Operator.AND)); }else{//如果查询内容为空展示所有的 MatchAllQueryBuilder matchAllQueryBuilder = QueryBuilders.matchAllQuery(); bool.must(matchAllQueryBuilder); } return bool; }
4.3查询
SearchRequestBuilder searchRequestBuilder = esTemplate.getClient().prepareSearch(index) .setTypes(type); if(!aggsisnull) searchRequestBuilder.addAggregation(aggs); if(!queryisnull) searchRequestBuilder.setQuery(query); SearchResponse resp = searchRequestBuilder.get(new TimeValue(30 * 1000));
5.为了更直观的看到查询结果,自己写了几个简单丑陋的页面
5.1查询所有{一共插入了7条测试数据,当然文档没有完全显示,截图知识一部分}
5.2.有查询内容且结果文档得分排序
5.3有查询的分类和内容且结果按得分排序
好了,ok!喜欢的可以点个赞哦...