引言
在Lucene中分析器其中举足轻重的作用,为了满足多种语言的支持,需要扩展一些分析器,仅仅是Lucene官方提供的标准分析器是远远不够的,比如对于中文,我们就需要引用第三方的中文分析器,下面就介绍几种分析器。
分析器的执行过程:
以标准分析器为例说明这个三个TokenFilter的作用:
第一个过滤器:将首字母小写
第二个过滤器:以空格为分割线,将句进行拆分成独立的单词
第三个过滤器:去掉一些没有意义的单词 比如 the a
引言
在Lucene中分析器其中举足轻重的作用,为了满足多种语言的支持,需要扩展一些分析器,仅仅是Lucene官方提供的标准分析器是远远不够的,比如对于中文,我们就需要引用第三方的中文分析器,下面就介绍几种分析器。
分析器的执行过程:
以标准分析器为例说明这个三个TokenFilter的作用:
第一个过滤器:将首字母小写
第二个过滤器:以空格为分割线,将句进行拆分成独立的单词
第三个过滤器:去掉一些没有意义的单词 比如 the a