问题背景:
项目中有些索引字段是富文本格式字符串(使用了富文本编辑器的内容没有将html标签过滤就存入了es里面),使用RestHighLevelClient api高亮搜索关键字,发现匹配返回的内容有缺失情况,比如es里面是
“<p>什么是快乐星球</p>”
高亮搜索快乐,发现后面的星球就没了
解决办法:
HighlightBuilder highlightBuilder = new HighlightBuilder().field("content")
.fragmentSize(800000