信息检索导论——四、索引构建

课件网址http://www.docin.com/p-473651858.html

1、硬件基础

2、基于块的排序索引方法
3、内存式单遍扫描索引构建算法
4、分布式索引构建
5、动态索引构建
6、安全性和排序式检索中的索引问题

1、硬件基础


与IR系统的设计相关的硬件基本性能参数如下:

1)访问内存数据比访问磁盘数据快得多(10倍左右)

2)硬盘寻道时间不进行数据传输,所以连续读取的数据块应在磁盘上连续存放

3)操所系统往往以数据块为单位进行读写,因此从磁盘读取一个字节和一个数据块耗时可能一样多(8KB到256KB不等)

4)数据从磁盘传输到内存是由系统总线而不是处理器来实现的,这意味着在磁盘I/O时处理器仍然可以处理数据。(比如将数据压缩后存储在磁盘上,若采用高效解压

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值