Lucene基础之核心概念及数据类型_lucene 数据类型-CSDN博客

本文链接：https://blog.csdn.net/AmbHowie/article/details/105575815

这篇博客介绍了Lucene的基础知识，包括字段、索引、分词和存储的概念。作者指出，字段需要搜索时建立索引，分词仅针对需要索引且可分割的数据类型，而存储适用于需要展示的字段。此外，文章还提及了Lucene的CURD操作，使用IndexWriter进行写入，IndexReader进行读取，IndexSearcher进行检索。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

博客链接：Cs XJH’s Blog
接触Lucene也有一段时间了，刚接触时应用起来难度不高，但里面的很多东西还是陌生的。经过一段熟悉之后，觉得大致了解了一些主要的东西，于是写篇博客记录下。

三个概念

Lucene和数据库类似，这里也有字段的概念。不同之处在于，这里的字段之间除了数据类型不同之外，对于索引、分词、存储的选择也各有不同。

索引
如果字段需要搜索，那么应该建立索引
分词
只有字段需要创建索引，才需要考虑是否要分词（分词即将字段值拆分成多个值进行索引）。并且，只有字段的数据类型可分割，才可以分词。
存储
如果字段写入后，需要再次获取并展示，那么应该存储。字段创建索引，但不一定会存储。

数据类型


名称	说明
IntPoint	对int型字段索引，只索引不存储
FloatPoint	对float型字段索引，其它同上
LongPoint	对long型字段索引，其它同上
DoublePoint	对double型字段索引，其它同上
BinaryDocValuesField	存储byte类型，只索引不存储
NumericDocValuesField	存储long型字段，用于评分、排序和值检索，如果需要存储值，还需要添加一个单独的StoredField实例
SortedDocValuesField	为数字或字符串值建立索引，可排序，如果需要存储值，还需要添加一个单独的StoredField实例
StringField	只索引但不分词，是否存储可选，所有的字符串会作为一个整体进行索引，例如通常用于id等
TextField	索引并分词，是否存储可选，常用于搜索字段
StoredField	只存储Field的值