数据库的索引

(一)顺序索引

1. 聚集索引(主索引)和非聚集索引(辅助索引)

(1)聚集索引:包含记录的文件按照某个搜索码的顺序排序。

(2)非聚集索引:搜索码制定的顺序与文件中记录的物理顺序不同(搜索码不是候选码)。

 

2. 稠密索引和稀疏索引

(1)稠密索引:文件中的每个搜索码值都有一个索引项。在稠密聚集索引中,索引项包括搜索码值以及指向具有该搜索码值的第一条数据记录的指针;在稠密非聚集索引中,索引必须存储指向所有具有相同搜索码值的指针列表。

(2)稀疏索引:只为搜索码的某些值建立索引项。只有索引是聚集索引时才能使用稀疏索引。

 

3. 多级索引:在原始的内层索引上构造一个稀疏的外层索引。

 

4. 静态索引的更新

 

(二)散列索引

1. 静态散列:将散列函数作用于搜索码以确定对应的桶,然后将此搜索码以及相应指针存入到此桶(或溢出桶)中。

 

2. 动态散列(可扩充散列)

(1)可扩充散列是在把记录插入文件时按需建桶的,可以通过桶的分裂或合并来适应数据库大小的变化。开始时,我们不使用散列值的全部b位,任意时刻我们使用的位数i满足0\leq i\leq b。这样的i个位用作附加的桶地址表中的偏移量。i的值随着数据库大小的变化而增大或减小。此外,我们给每一个桶附加一个整数值i_j,用来表示第j个桶的散列前缀长度。

 

(2)动态索引的查询和更新

(a)查询:系统先取得h(K_l)的前i个高位,然后为这个位串查找对应的表项,再根据表项中的指针得到桶的位置。

(b)插入:如果该桶有剩余空间,系统将该记录直接插入该桶;否则,如果桶j已满,系统必须分裂这个桶,并将该i=i_j桶中已有的记录和新纪录一起进行重新分配。

首先,如果i=i_j,那么在桶地址表只有一个表项指向该桶,所以系统需要增加桶地址表的大小(i=i+1);如果i> i_j,那么在桶地址表有多个表项指向该桶,系统则不需要扩大桶地址表,就能直接分裂。

分裂时加入新桶k,并且令i_k=i_j=i_j+1,根据散列值的前i_j(即i_k)位重新分配已有记录。

系统现在再次尝试插入该新纪录,通常这一尝试会成功。但是,如果桶j中原有的所有记录和新纪录都具有相同的散列值前缀,该桶就必须再次分裂。如果桶j中所有记录具有相同的搜索码,那么多少次分裂也不能解决问题。在这种情况下,就需要采用溢出桶来存储记录。

(c)删除:相当于插入的逆过程,系统不仅要把搜索码从桶中删除,还要把记录从桶中删除。如果这时桶成为空的,那么桶也需要删除。与桶的合并不同,若桶地址表很大,则改变该表的大小是一个开销很大的操作。因此只有桶数目减少很多时,减小桶地址表的大小才是必要的。

 

(三)对比总结

(1)利用稠密索引通常可以比稀疏索引更快地定位一条记录。但是,稀疏索引也有比稠密索引优越的地方:它所占空间较小,并且插人和删除时所需的维护开销也较小。

(2) 按聚集索引顺序对文件进行顺序扫描是非常有效的,因为文件中记录的物理存储顺序和索引顺序一致。但是,我们不能(除了极少数特殊情况外)使存储文件的物理顺序既和聚集索引的搜索码顺序相同,又和辅助索引的搜索码顺序相同。由于辅助码的顺序和物理码的顺序不同,因此如果我们想要按辅助码的顺序对文件进行顺序扫描,那么每读一条记录都很可能需要从磁盘读入一个新的块,这是很慢的。辅助索引能够提高使用聚集索引搜索码以外的码的查询性能。但是,辅助索引显著增加了数据库更新的开销。

(3)顺序文件组织的一个缺点是我们必须访问索引结构来定位数据,或者必须使用二分法搜索,这将导致过多的I/O操作。基于散列(hashing)技术的文件组织使我们能够避免访问索引结构。散列函数的设计需要认真仔细。一个糟糕的散列函数可能导致查找所花费的时间与文件中搜索码数目成正比;一个设计良好的散列函数一般情况下查找所花费时间是一个(较小的)常数,而与文件中搜索码的个数无关。

(4)可扩充散列最主要的优点是其性能不随文件的增长而降低。此外,其空间开销是最小的。尽管桶地址表带来了额外的开销,但该表为当前前缀长度的每个散列值存放一个指针,因此该表较小。可扩充散列与其他散列形式相比,主要的空间节省是不必为将来的增长保留桶;桶的分配是动态的。可扩充散列的一个缺点在于查找涉及一个附加的间接层,因为系统在访问桶本身之前必须先访问桶地址表。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值