- 博客(1)
- 收藏
- 关注
原创 索引
在这个信息爆炸的年代, 信息索引的重要性不言而喻。现在主要的索引结构就是倒排索引,又称为记录文件(posting file),词汇索引(concordance)。 其他的还有签名文件(signature file), 和 位图(bitmap)。 倒排索引在结构上分为,倒排列表(inverted list)和字典, 倒排列表就是记录一列指针, 每个指针表示了术语所在的文档的编号,甚至是在文档中的位置。 而字典就是记录了术语和倒排列表的对应关系。 举个例子,cold (2;1,4)表示cold这个词出现
2010-06-21 17:37:00 1037
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人