静态索引
基本概念与术语
- 输入顺序文件:按照记录进入系统的顺序存储记录,输入顺序文件相当于未排序的线性表
- 主码:数据库中每条记录的唯一标识
- 辅码:数据库中可以出现重复值的码(注意,主码是唯一的,就类似于一个名字可以对应很很多人,但是一个身份证号就只可对应一个人),辅码索引把一个辅码值与具有这个辅码值得每一条记录的主码值关联起来。
- 索引:一个关键码与它对应的数据记录的位置相关联的过程
- 索引文件:用于记录这种联系的文件的组织结构
- 稠密索引:主文件关键码未排序、对每个记录都建立一个索引(一一对应)
- 稀疏索引:已排序、关键码顺序分块、索引指向这一组记录在磁盘中的起始位置(类似于索引排序,建立子表)
静态索引
- 索引结构在一开始文件建成的时候就生成
- 只有当文件再组织时才允许改变索引结构
- 这里有一种结构:多分树(二叉树转化成多分树,类似于B-树,访问外存3次,其中2次访问索引块,1次访问外存数据块)
- 这里就有基于多分树的ISAM文件(在我的另一篇博客——《数据结构之外部排序文件》中有提到,这里就不再赘述)
倒排索引
倒排索引分成两种,一种是基于属性的倒排,一种是对正文文件的倒排
基于属性的倒排
- 按照属性建立的索引
- 基于“属性-指针”对 索引