删除文档文件(del) 格式如下:
被删除文档文件(Deleted Document File: .del)
1)Format:在此文件中,Bits和 DGaps只能保存其中之一,-1表示保存DGaps,非负
值表示保存 Bits。
2)ByteCount:此段中有多少文档,就有多少个 bit 被保存,但是以 byte 形式计数,
也即Bits的大小应该是 byte 的倍数。
3)BitCount:Bits中有多少位被至1,表示此文档已经被删除。
4)Bits:一个数组的 byte,大小为 ByteCount,应用时被认为是 byte*8个 bit。
5)DGaps:如果删除的文档数量很小,则 Bits 大部分位为 0,很浪费空间。DGaps 采
用以下的方式来保存稀疏数组:比如第十,十二,三十二个文档被删除,于是第十,
十二,三十二位设为1,DGaps也是以 byte为单位的,仅保存不为0 的byte,如第
1 个 byte,第 4个 byte,第 1 个 byte十进制为20,第 4 个 byte十进制为1。于是
保存成 DGaps,第1 个byte,位置1 用不定长正整数保存,值为20用二进制保存,
第 2个 byte,位置4 用不定长正整数保存,用差值为 3,值为1 用二进制保存,二
进制数据不用差值表示。