在 Elasticsearch 中,高亮(highlighting)是通过标签(例如)将匹配搜索条件的文本突出显示的。如果您发现高亮效果在某个字段上溢出到其他字段,可能有几个原因:
同一片文本多次匹配: 如果文本中的某一部分匹配了多个查询条件,高亮标签可能会应用于每个匹配的实例,导致标签交叠。
字段重叠: 如果两个字段的值在视觉上重叠,高亮标签可能会应用于两个字段,使得高亮效果跨越字段。
为了解决这个问题,您可以尝试以下方法:
- 调整高亮设置:
在查询中使用 “highlight” 字段指定要高亮的字段,并调整 “pre_tags” 和 “post_tags” 参数以确保标签不会溢出到其他字段。例如:
"highlight": {
"fields": {
"your_field": {
"pre_tags": [""],
"post_tags": [""]
}
}
}
在这个示例中,我们使用了自定义的类名和样式,但您可以根据需要调整。
- 调整文本索引:
确保文本字段被正确分词,并且每个词语被独立索引。这可以通过适当的分词器和分析器来实现。例如,使用 “standard” 分词器或其他适合您的需求的分词器。
"mappings": {
"properties": {
"your_field": {
"type": "text",
"analyzer": "standard"
}
}
}
- 在返回结果时排除高亮:
在搜索结果中,您可以选择排除高亮字段,只返回原始的字段值。这可以通过设置 “highlight” 字段的 “require_field_match” 参数来实现。如果设置为 true,则只有与查询完全匹配的字段才会被高亮。
"highlight": {
"require_field_match": true,
"fields": {
"your_field": {}
}
}
亲测第三种方案简单易行,值得一试~
在java代码中设置requireFieldMatch为true即可
//关键词搜索
if (!ObjectUtils.isEmpty(searchOption.getKeyWords())) {
QueryBuilder queryBuilder = searchKeyWordsWithOutBoostConfig(boolQueryBuilder, searchOption.getKeyWords());
searchSourceBuilder.query(queryBuilder);
//设置高亮
HighlightBuilder highlightBuilder = searchOptionBuilder.assembleHighLight(
"title.han", "remark.han").requireFieldMatch(true);
searchSourceBuilder.highlighter(highlightBuilder);
}