倒排文件和多重表文件的区别在于次关键字索引的结构不同。通常,称倒排文件中的次关键字索引为倒排表,具有相同次关键字的记录之间不设指针相链,而在倒排表中该次关键字的一项中存放这些记录的物理记录号。
例如,下列数据文件的倒排表如图10-8所示。
物理记录号 |
|
01
| |
02
| |
03
| |
04
| |
05
| |
06
| |
07
| |
08
| |
09
| |
10
| |
软件 | 01,02,07,08 |
计算机 | 03,05 |
应用 | 04,06,09,10 |
(a)专业倒排表
350~399 | 02,05,06,07,09,10 |
400~449 | 01,03,04,08 |
(b)已修学分倒排表
甲 | 02,04,06,07,08,09,10 |
乙 | 03,05,07 |
丙 | 01,02,03,04,08 |
丁 | 01,03,05,09 |
(c)选修课目倒排表
图10-8 倒排文件索引示例
倒排表作索引的好处在于检索记录较快。特别是对某些询问,不用读取记录,就可得到解答,如询问“软件”专业的学生中是否有选修课程“乙”的,则只要将“软件”索引中的记录号和“乙”索引中的记录号作求“交”的集合运算即可。
在插入和删除记录时,倒排表也要作相应的修改,值得注意的是倒排表中具有同一次关键字的记录号是有序排列的,则修改时要作相应移动。
若数据文件非串联文件,而是索引顺序文件(如ISAM文件),则倒排表中应存放记录的主关键字而不是物理记录号。
倒排文件的缺点是维护困难。在同一索引表中,不同的关键字其记录数不同,各倒排表的长度不等,同一倒排表中各项长度也不等。