索引的建立过程,就是生成下面的这些文件的过程。理解这些文件格式,是理解索引建立,索引合并和数据查找的关键
.sph, header file
.spi, dictionary (aka--also know as: wordlist)
.spd, document lists (aka--also know as: doclists)
.spp, keyword positions lists (aka--also know as: hitlists)
.spa, attribute values
.spm, MVA values
.spk, kill list (aka--also know as: klist)
.spl, establish locks on the whole index.
synonyms.dat和uni.lib等字典文件格式类似,这里只画出synonyms.dat。







本文详细介绍了搜索引擎索引建立的过程及涉及的各种文件格式,包括.sph、.spi、.spd等,深入剖析了这些文件如何支撑起索引的构建、合并及数据查找等功能。
1206

被折叠的 条评论
为什么被折叠?



