lucene结构详解之九删除文档文件(del)

删除文档文件(del) 格式如下:




 被删除文档文件(Deleted Document File: .del)  
 1)Format:在此文件中,Bits和 DGaps只能保存其中之一,-1表示保存DGaps,非负
值表示保存 Bits。  
 2)ByteCount:此段中有多少文档,就有多少个 bit 被保存,但是以 byte 形式计数,
也即Bits的大小应该是 byte 的倍数。  
 3)BitCount:Bits中有多少位被至1,表示此文档已经被删除。  
 4)Bits:一个数组的 byte,大小为 ByteCount,应用时被认为是 byte*8个 bit。  
 5)DGaps:如果删除的文档数量很小,则 Bits 大部分位为 0,很浪费空间。DGaps 采
用以下的方式来保存稀疏数组:比如第十,十二,三十二个文档被删除,于是第十,
十二,三十二位设为1,DGaps也是以 byte为单位的,仅保存不为0 的byte,如第
1 个 byte,第 4个 byte,第 1 个 byte十进制为20,第 4 个 byte十进制为1。于是
保存成 DGaps,第1 个byte,位置1 用不定长正整数保存,值为20用二进制保存,
第 2个 byte,位置4 用不定长正整数保存,用差值为 3,值为1 用二进制保存,二
进制数据不用差值表示。  





  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值