课件网址http://www.docin.com/p-473651858.html
1、硬件基础
2、基于块的排序索引方法
3、内存式单遍扫描索引构建算法
4、分布式索引构建
5、动态索引构建
6、安全性和排序式检索中的索引问题
1、硬件基础
与IR系统的设计相关的硬件基本性能参数如下:
1)访问内存数据比访问磁盘数据快得多(10倍左右)
2)硬盘寻道时间不进行数据传输,所以连续读取的数据块应在磁盘上连续存放
3)操所系统往往以数据块为单位进行读写,因此从磁盘读取一个字节和一个数据块耗时可能一样多(8KB到256KB不等)
4)数据从磁盘传输到内存是由系统总线而不是处理器来实现的,这意味着在磁盘I/O时处理器仍然可以处理数据。(比如将数据压缩后存储在磁盘上,若采用高效解压