前言
Analysis:文本分析是把全文本转换成一系列单词(term/token)的过程,也叫分词。Analysis 是通过 Analyzer 来实现的,可以使用 ES 内置的分析器,也可使用定制的分析器。在写入数据和查询数据的时候,都需要用相同的分析器对语句进行分析。
Analyzer
Analyzer 分词器是专门处理分词的组件,由三部分组成:Character Filters(处理原始文本,例如去除html、特殊字符)、Tokenizer(按照规则切分为单词)、Token Filters(将切分的单词加工,小写、删除 stopwords(停用词),增加同义词)。