在 Elasticsearch 的搜索结果中,如果为某个字段开启了高亮显示功能,那么该字段匹配的内容将会被包裹在指定的 HTML 标记中。而 getFragments()
方法返回这些包裹了匹配内容的 HTML 片段(fragment)组成的数组。对于每个片段,我们可以通过调用 .string()
方法来获取其中的纯文本内容。
具体来说,string()
方法是 Text
类的一个方法,它将一个包含 HTML 标记的文本字符串转换为一个纯文本字符串。在 Elasticsearch 中,每个 HighlightField
对象中的所有片段都是 Text
对象。
因此,在 Elasticsearch Java API 中,我们可以使用以下代码将高亮显示的第一个片段的纯文本内容保存到一个字符串变量中:
String highlightedText = highlightFields.get("field_name").getFragments()[0].string();
其中,highlightFields
是一个 SearchHit
对象中的一个成员变量,用于存储匹配查询条件的字段的高亮信息;"field_name"
是我们想要获取高亮显示片段的字段名;[0]
表示我们要获取的是高亮显示片段数组中的第一个元素,即第一个片段;.string()
则表示获取该片段的纯文本内容。