Elasticsearch 知识分类聚合查询以及根据字段权重查询实践

最新推荐文章于 2024-05-18 15:36:01 发布

最后的一片叶子

最新推荐文章于 2024-05-18 15:36:01 发布

阅读量1.2k

点赞数 1

文章标签： elasticsearch

本文链接：https://blog.csdn.net/qq_35906478/article/details/106936882

版权

1.业务背景：首先搜索的内容要首先完全匹配知识分类，并且按关键字、摘要、其他字段权重依次减低进行查询结果按得分从高到低，并对各个知识分类的查询文档数进行统计

难点：因为每个文档所涉及到的知识分类可能是多个，所以统计的时候，用分类的keyword属性类型进行聚合查询就是不可能实现的

2.首先看一下mapping结构

知识分类属性：File_Clid ,知识关键字：File_KeyWord ，知识摘要：File_Abstract

首先：要对知识分类File_Clid这个用于聚合的属性，进行分词测试，fielddata:true表示text类型的字段默认禁用开启，如果要对这个字段进行聚合和排序等操作时要开启，加载所对应的的字段的postlist到内存堆中以便进行聚合和排序

因为File_Clid的值可能是多个知识分类所以keyword肯定就排除掉了，然后测试ik_max_word（不合适）

ik_smart分词测试（合适）

standard分词测试（合适）

所以对知识分类File_Clid所用分词器用ik_smart或者standard

3.kibana查询

4.上代码

4.1构建聚合查询条件
@Override
protected AggregationBuilder buildAggs(JSONObject jsonObject) {
    TermsAggregationBuilder field = AggregationBuilders.terms("知识分类").field("File_Clid");
    return field;
}
4.2构建按权重查询的条件
@Override
protected QueryBuilder buildQuery(JSONObject jsonObject) {

    BoolQueryBuilder bool = QueryBuilders.boolQuery();
    Object file_clid = jsonObject.get("File_Clid");
    Object content = jsonObject.get("content");
    if(ObjectUtils.isNotEmpty(file_clid))//分类不为空
        bool.must(QueryBuilders.matchQuery("File_Clid", file_clid.toString()).operator(Operator.AND));
    if(ObjectUtils.isNotEmpty(content)){//查询内容不为空按关键字、摘要、其他属性权重
        QueryStringQueryBuilder queryStringQueryBuilder = QueryBuilders.queryStringQuery(content.toString());
        Map<String,Float> boost = new HashMap<>();
        boost.put("File_KeyWord",5.0f);//关键字
        boost.put("File_Abstract",2.0f);//摘要
        boost.put("File_Title",1.0f);
        boost.put("File_Fun",1.0f);
        boost.put("File_Structure",1.0f);
        boost.put("Principle",1.0f);
        queryStringQueryBuilder.fields(boost);
        bool.must(queryStringQueryBuilder.defaultOperator(Operator.AND));
    }else{//如果查询内容为空展示所有的
        MatchAllQueryBuilder matchAllQueryBuilder = QueryBuilders.matchAllQuery();
        bool.must(matchAllQueryBuilder);
    }
    return bool;
}

4.3查询

SearchRequestBuilder searchRequestBuilder = esTemplate.getClient().prepareSearch(index)
        .setTypes(type);
if(!aggsisnull)
    searchRequestBuilder.addAggregation(aggs);
if(!queryisnull)
    searchRequestBuilder.setQuery(query);
SearchResponse resp = searchRequestBuilder.get(new TimeValue(30 * 1000));

5.为了更直观的看到查询结果，自己写了几个简单丑陋的页面

5.1查询所有{一共插入了7条测试数据，当然文档没有完全显示，截图知识一部分}

5.2.有查询内容且结果文档得分排序

5.3有查询的分类和内容且结果按得分排序

好了，ok！喜欢的可以点个赞哦...

最后的一片叶子

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
Elasticsearch 知识分类聚合查询以及根据字段权重查询实践

1.业务背景：首先搜索的内容要首先完全匹配知识分类，并且按关键字、摘要、其他字段权重依次减低进行查询结果按得分从高到低，并对各个知识分类的查询文档数进行统计难点：因为每个文档所涉及到的知识分类可能是多个，所以统计的时候，用分类的keyword属性类型进行聚合查询就是不可能实现的2.首先看一下mapping结构知识分类属性：File_Clid ,知识关键字：File_KeyWord ，知识摘要：File_Abstract首先：要对知识分类File_Clid这个用于聚合的属性，进行分词
复制链接

扫一扫