Lucene索引详解

      今天我给大家讲讲Lucene是如何索引文档的,索引文档就是把文档变成索引这种数据结构的过程。

       文档是Lucene索引的基本单位,比文档更小的单位是字段,字段是文档的一部分,每个字段由名称、类型和取值组成。字段的取值一般为文本(字符串、字符流)、二进制类型和数值类型。Lucene中的字段类型主要有以下几种:

            TextField

            TextField会把字段的内容索引并词条化,但是不保存词向量     

            StringField:

            StringField只会对该字段的内容索引,但是并不词条化,也不保存词向量。 

            IntPoint

            IntPoint适合int类型的字段。IntField是为了快速过滤的,如果需要展示出来另存一个字段。

            LongPoint

            LongPoint和IntPoint类似,区别在于LongPoint适合索引为长整型long类型的字段。

            FloatPoint 

            FloatPoint和IntPoint类似,区别在于FloatPoint适应索引值为float类型的字段。

            DoublePoint 

            DoublePoint和IntPoint类似,区别在于DoublePoint适应索引值为double类型的字段。

            SortedDocValuesField

            存储值为文本内容的DocValue字段,SortedDocValuesField适合索引字段值为文本内容并且按值进行排序的字段。 

            SortedSetDocValuesField

            存储值为多值域的DocValue字段,SortedSetDocValuesField适合索引字段值为文本内容并且按值进行分组、聚合等操作的字段。            

            NumericDocValuesField

            存储值为单个数值类型的DocValue字段,主要包括int、long、float、double。

            SortedNumericDocValuesField

            存储值数值类型的有序数组列表的DocValues字段。

            StoredFileld

            StoredFileld适合索引只需要保存字段值不进行其他操作的字段。

 

        

           

                              

 

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值