数据库索引 - 顺序文件索引

按物理结构划分,索引可分为顺序文件索引、B树索引和散列表索引。商用数据库产品的索引主要是B树索引和散列表索引。但顺序文件索引作为一种基本的索引数据结构也应当被关注。

顺序文件索引定义:以顺序文件的物理存储结构来存储的索引。即[键值,数据记录指针]对以数组的形式有序储存。

顺序文件索引原理:指针占用空间的大小远小于实际记录,可以支持快速扫描,尤其是在内存中快速扫描。

稀疏索引:如果表过大,将导致索引占用的空间也过大,因此有了稀疏索引,即并不是每个键值都出现在索引数组中。稀疏索引一定程度上牺牲了精确查找的效率,但提高了大表的查询效率。相对稀疏索引的是稠密索引。

多级索引:在一级索引(可以是稀疏或稠密的)上建立二级索引,提高效率。二级索引必然是稀疏的。

允许存在重复键的索引:和其他索引一样,顺序文件索引也允许键值重复。

主索引和辅助索引:对于主索引,数据记录和索引一样,都按照键值有序排列。对于辅助索引,数据记录的储存顺序和索引键值没有必然联系。辅助索引必然是稠密的。

利用桶技术减少索引占用空间:没有利用桶技术的索引,键值出现的次数等于表记录数。如果存在重复键值,将浪费大量空间。在索引块和数据块之间加入桶,可以解决这个问题。每个键值只在索引中出现一次,并指向属于该键值的桶。桶中存放指向数据记录的指针。

倒排索引和文档检索:倒排索引解决了以关键字为基础的文档检索问题。对于倒排索引,一个文档被视为一个记录,其中的关键字被视为属性,以关键字为键值建立多个索引,指向每个文档或文档中出现该关键字的位置。“倒排”的含义就是从关键字倒过来找到文档。倒排索引是互联网文档检索的核心技术。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值