Elasticsearch 知识分类聚合查询以及根据字段权重查询实践

1.业务背景:首先搜索的内容要首先完全匹配知识分类,并且按关键字、摘要、其他字段权重依次减低进行查询结果按得分从高到低,并对各个知识分类的查询文档数进行统计

难点:因为每个文档所涉及到的知识分类可能是多个,所以统计的时候,用分类的keyword属性类型进行聚合查询就是不可能实现的

2.首先看一下mapping结构

知识分类属性:File_Clid ,知识关键字 :File_KeyWord ,知识摘要:File_Abstract

首先:要对知识分类File_Clid这个用于聚合的属性,进行分词测试,fielddata:true表示text类型的字段默认禁用开启,如果要对这个字段进行聚合和排序等操作时要开启,加载所对应的的字段的postlist到内存堆中以便进行聚合和排序

因为File_Clid的值可能是多个知识分类所以keyword肯定就排除掉了,然后测试ik_max_word(不合适)

ik_smart分词测试(合适)

standard分词测试(合适)

所以对知识分类File_Clid所用分词器用ik_smart或者standard

3.kibana查询

4.上代码

4.1构建聚合查询条件
@Override
protected AggregationBuilder buildAggs(JSONObject jsonObject) {
    TermsAggregationBuilder field = AggregationBuilders.terms("知识分类").field("File_Clid");
    return field;
}
4.2构建按权重查询的条件
@Override
protected QueryBuilder buildQuery(JSONObject jsonObject) {

    BoolQueryBuilder bool = QueryBuilders.boolQuery();
    Object file_clid = jsonObject.get("File_Clid");
    Object content = jsonObject.get("content");
    if(ObjectUtils.isNotEmpty(file_clid))//分类不为空
        bool.must(QueryBuilders.matchQuery("File_Clid", file_clid.toString()).operator(Operator.AND));
    if(ObjectUtils.isNotEmpty(content)){//查询内容不为空按关键字、摘要、其他属性权重
        QueryStringQueryBuilder queryStringQueryBuilder = QueryBuilders.queryStringQuery(content.toString());
        Map<String,Float> boost = new HashMap<>();
        boost.put("File_KeyWord",5.0f);//关键字
        boost.put("File_Abstract",2.0f);//摘要
        boost.put("File_Title",1.0f);
        boost.put("File_Fun",1.0f);
        boost.put("File_Structure",1.0f);
        boost.put("Principle",1.0f);
        queryStringQueryBuilder.fields(boost);
        bool.must(queryStringQueryBuilder.defaultOperator(Operator.AND));
    }else{//如果查询内容为空展示所有的
        MatchAllQueryBuilder matchAllQueryBuilder = QueryBuilders.matchAllQuery();
        bool.must(matchAllQueryBuilder);
    }
    return bool;
}

4.3查询

SearchRequestBuilder searchRequestBuilder = esTemplate.getClient().prepareSearch(index)
        .setTypes(type);
if(!aggsisnull)
    searchRequestBuilder.addAggregation(aggs);
if(!queryisnull)
    searchRequestBuilder.setQuery(query);
SearchResponse resp = searchRequestBuilder.get(new TimeValue(30 * 1000));

5.为了更直观的看到查询结果,自己写了几个简单丑陋的页面

5.1查询所有{一共插入了7条测试数据,当然文档没有完全显示,截图知识一部分}

5.2.有查询内容且结果文档得分排序

5.3有查询的分类和内容且结果按得分排序

好了,ok!喜欢的可以点个赞哦...

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
可以使用 Elasticsearch Java API 中的 Aggregation API 来实现聚合查询某一字段分组的数量。具体步骤如下: 1. 创建一个 SearchRequest 对象,并设置索引及查询条件: ``` SearchRequest searchRequest = new SearchRequest("index_name"); SearchSourceBuilder searchSourceBuilder = new SearchSourceBuilder(); searchSourceBuilder.query(QueryBuilders.matchAllQuery()); ``` 2. 创建一个 TermsAggregationBuilder 对象,并设置聚合字段: ``` TermsAggregationBuilder aggregationBuilder = AggregationBuilders.terms("group_by_field") .field("field_name") .size(10); // 设置返回结果的数量 ``` 3. 将聚合对象添加到 SearchSourceBuilder 中: ``` searchSourceBuilder.aggregation(aggregationBuilder); ``` 4. 执行查询,并处理返回结果: ``` searchRequest.source(searchSourceBuilder); SearchResponse response = client.search(searchRequest, RequestOptions.DEFAULT); Terms termsAggregation = response.getAggregations().get("group_by_field"); for (Terms.Bucket bucket : termsAggregation.getBuckets()) { String key = bucket.getKeyAsString(); long count = bucket.getDocCount(); System.out.println("Key: " + key + ", Count: " + count); } ``` 以上代码中,`client` 是一个 Elasticsearch 客户端对象,通过 `response.getAggregations().get("group_by_field")` 获取到聚合结果对象,然后遍历 Buckets 获取每个分组的 key 和 count。 需要注意的是,这里使用的是 TermsAggregationBuilder 对象来实现分组聚合查询,如果需要根据其他条件进行聚合查询,则需要使用其他类型的 AggregationBuilder 对象。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值