Lucene TaxonoFacet原理

1、Facet索引第二种方式采用Taxono索引帮助实现。 f u l l p a t h full_path fullpath

1)在建立索引时,可以设置FacetsConfig的setindexFieldName(FieldName, FieldName别名),可以通过这种方式只统计单一Field数据个数。

2)在检索统计时建立FastTaxonomyFacetCounts时就可以使用别名了。

实现原理:

当建立索引基础时没有设置FacetsConfig别名时,在基础索引中建立FieldName名为$facets的字段名用于统计。

当设置别名时,会在基础索引中建立以别名为FieldName的名字段名。

除了基础索引还会建立一个TaxonoIndex索引,这个索引用于取出统计的Name。

当向Document中增加FacetField统计字段,实计上是一个BinaryDocValues字段,统计时通过基础索引进行统计,BinaryDocValues占用空间很小,速度也很快,

统计后,通过ID向TaxonoIndex中取出统计Name来进行展示。

对基础索引进行删除Doc时,不会对TaxonoIndex进行改变,

对增加和修改基础索引时要对TaxonoIndex进行修改,调用FacetsConfig.build会对TaxonoIndex原有的数据会形成一个Map对加入基础索引中的数据行关联,

也就是说在TaxonoIndex中同一个FieldValue中只会出现一次。

当增加和修改时没有对TaxonoIndex进行操作时,是不会对增加的这个FiledName进行统计的。

2、TaxonoIndex有个存储技巧会把FieldName和FieldValue连接在一起进行存储,这样存储会对取出某个字段的值加快速度。

如果喜欢搜索技术请关注我的公众号吧
每天会持续更新搜索相关技术
在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值