理解分析过程
探究QueryParser的相关问题
编写自定义分析器
处理非英语语种
分析的操作
提取单词
去除标点符号
去掉单词上的音调符号
将字母转换为小写
词干还原(excepted -> except)
分析器的选择
所要检索的语言
文本所属的领域(不同的行业有不同的术语,缩写词和缩略语)
分析器粒度
Indexwriter级
文档对象级
特定域对象级
PerFieldAnalyzerWrapper类的对象可以将分析每个域的任务委托给与域名相关联的分析器
0位置增量(用于同义词)
TokenStream
Tokenizer
CharTokenizer
WhitespaceTokenizer
LetterTokenizer
StandardTokenizer
TokenFilter
LowerCaseFilter
StopFilter
PorterStemFilter
StandardFilter