1.field域
Lucene根据文档中的域的属性,确定是否要分词、创建索引。
三大属性:分词(tokenized):只有设置了分词属性为true,lucene才会对这个域进行分词处理。
索引(indexed):只有设置了索引属性为true,lucene才为这个域的Term词创建索引。
存储(stored):只有设置了存储属性为true,在查找的时候,才能从文档中获取这个域的值。
特点:三大属性彼此独立;通常分词是为了创建索引;不存储这个域文本内容,也可以对这个域先分词、创建索引。
域的常用类型:Field类型 是否分词 是否索引 是否存储
StringField N Y Y或N
LongField Y Y Y或N
FloatField Y Y Y或N
StoredField N N Y
TextField N N Y
IKAnalyzer:IKAnalyzer继承Lucene的Analyzer抽象类,使用IKAnalyzer和Lucene自带的分析器方法一样,将Analyzer测试代码改为IKAnalyzer测试中文分词效果。