名词:索引顺序存取方法ISAM—Indexed Sequential Access Method
索引顺序存取方法(ISAM, Indexed Sequential Access Method)最初是IBM公司发展起来的一个文件系统,可以连续地(按照他们进入的顺序)或者任意地(根据索引)记录任何访问。每个索引定义了一次不同排列的记录。现在这个概念用在许多场合:
- 特指IBM公司的ISAM产品
- 数据库系统中提供用户接口从数据文件中检索数据。
- 通常指,数据库的索引,这种索引被大多数数据库所采用,包括关系数据库或其它。
在ISAM系统,数据组织成有固定长度的记录,按顺序存储的。
-------------------------------------------------------------------------
首先介绍一些概念
索引是在磁盘上组织数据记录的一种数据结构,它用于优化某类数据检索的操作。索引使得我们能够有效地检索满足索引的搜索码字段上的搜索条件的那些记录。可以在一个给定的数据记录集合上创建多个索引,每一个索引都有不同的搜索码,以支持那些不能被文件组织有效支持的搜索操作。
我们使用术语数据项来指代存储在索引文件中的记录。搜索码值为k的数据项记为k*,包含有足够的信息以定位(一个或多个)搜索码值为k的数据记录。我们可以有效地搜索一个索引来找到想要的数据项,然后使用这些数据项来获得数据记录。(数据项 数据记录)
基于树的索引——树型的数据结构
构成形式:数据项按照搜索码值进行排列,并且维护一个层次化的搜索数据结构,以便将搜索定向到数据项所属的页面。
图中显示了一个雇员记录文件,按照搜索码“年龄”组织成一个树结构的索引。该图中的每一个节点(例如,节点A,B,L1,L2)是一个物理页,并且检索一次节点就要涉及一次I/O。树的最下层,就是叶子层,包含数据项。在我们的示例中,这些数据就是雇员记录。
这种结构使