From 《数据库管理系统原理与设计》
这是理论学习过程一些术语,名词的记录。在后面的课程中经常出现,却由于没有理解清楚而越来越多不懂。所以现在做点记录,后面慢慢补充。
理论与实践相结合才能更好的学习,但是现在由于时间紧张,而且缺乏一个好的实验材料,所以实践部分比较薄弱。希望各位看官可以给点意见~
8
文件组织:就是当文件存储在磁盘上时,组织文件中记录的方法。每一种文件组织都会使得某些操作的效率很高而另一些操作效率低。
索引技术可以帮助我们以更多种方式来访问一个记录集合和查询。
8.1
磁盘上读写信息的单位是页
文件中每一个记录都有一个唯一的标识符,称为记录id,简称rid。一个rid有一个属性,可以用它来识别包含该记录的页在磁盘上的地址。
8.2
索引是在磁盘上组织数据记录的一种数据结构。
数据项来指代存储在索引文件中的记录。收索码值为K的数据项记为K*,包含足够的信息以定位搜索码值为K的数据记录。
3种不同的方式:
1)K*是一个真正的数据记录
2)数据项是一个<k,rid>对
3)<k,rid-list>对
如果想在一个数据记录的集合上建立多个索引,至少一个索引应该采取第一种方式,为了避免多次存储数据记录的情况。
8.2.1聚簇索引
如果一个文件组织成如下形式:数据记录的顺序与某一索引的数据项顺序相同或类似,则称这一索引为聚簇索引。
由于数据更新时维护文件的有序性的代价很高,所以很少有保持有序的。
实践中,只有使用第一种方式的索引是聚簇索引。在索引上搜索或者扫描只返回其数据项,即使它包含组织数据项的其它信息。
8.2.2主索引和次索引