数据库-8-数据库索引

ch08-数据库索引

1. 索引

1.1. 什么是索引

  1. 索引就像图书馆中的卡片目录。
  2. 每个卡(条目)具有:(键值,行指针)
    1. 键值用于查找
    2. 行指针(ROWID)足以在磁盘上定位行(一个I/O)
  3. 条目通常按"B树"中的查找键按字母顺序排列,也可能会被散列。
    1. 索引非常类似于内存驻留结构。
    2. 但是索引是磁盘驻留的。就像数据本身一样,通常一次也无法全部放入内存中。
  4. 索引可以被认为是一个有两列的表:键值和行指针

1.2. 索引创建

CREATE [UNIQUE] INDEX indexname 
  ON tablename (colname [ASC | DESC]
    { , colname [ASC | DESC] ...});
  1. 键值和列必须是一对一关系
  2. 我们可以使用UNIQUE INDEX在Create Table Statement中实现UNIQUE约束。
  3. UNIQUE索引的例子

  • cidx索引中的每个索引键值仅对应于一个客户行。
    • 索引键与主键或候选键的关系概念完全不同。
    • 但是,我们可以使用UNIQUE INDEX和NOT NULL来实现主键或候选键。

1.3. 使用索引

  1. 在索引被创建后,索引被排序并且存储在磁盘中
  2. 排序是按列值asc或desc进行的,如Select语句的SORT BY描述中所述。
  3. 索引建立之后,表的修改会直接反应在索引中,而并不需要重新建立索引

1.4. 索引删除

DROP INDEX indexname;

2. 磁盘存储

2.1. 存储分类

  1. 计算机内存:快,但是易失的存储
  2. 磁盘存储:非常慢,非易失,低价

2.2. 不同存储的访问时间

2.2.1. 磁盘访问

  1. 寻道时间:圆盘臂移入或移出到正确的磁道位置。(.008s)
  2. 旋转延时:磁盘盘旋转到正确的角度位置。(.004s)
  3. 传输时间:磁盘臂在适当的表面上读取/写入磁盘页面。(.0005s)
  4. 访问时间:(10-8 - 10-7 s)

  1. 在很多结构中一行是连续的多个字节,很多行位于一页上(被称为Oracle的块)
  2. 头信息包含当前页是数据段还是索引段,以及当前页的编号。

  • 磁盘中的行是从右侧向左侧添加的
  • 标头后,行目录条目从左到右。给出相应行起点的偏移量。
  • 在页面上提供行槽的编号。
  • 当一行被添加后,会立即告诉我们是否还有剩余的空间给新的行文件
  • 从概念上讲,中间的所有空间都表示删除行和回收空间必须移至填补空白的时间。
  • 磁盘指针:可以用页码§和插槽号(S)唯一指定表中的一行。

2.2.2. 内存缓存

  1. 将磁盘页读入到内存缓存,所以可以访问。一旦放在磁盘上正确的位置,传输时间就很便宜。
  2. 每次都希望有一个页面从磁盘,dkpgaddr,h(dkpgaddr)上的哈希表到Hashlookaside表中的条目,以查看该页面是否已在缓冲区中。

  1. 优点
    1. 节省磁盘I/O时间
    2. 在IO时间为CPU寻找一些事情来做

3. B树索引

  1. 每一个树的结点都是一个满了的磁盘页
  2. 每一个树的结点都有很多扇区

3.1. 创建索引的步骤

  1. 从磁盘中读出所有的N行
  2. 为每一行生成一个(键值, 行ID)对
  3. 将根据键值排序好的列表存储到磁盘中
  4. 如果具有NOSORT子句,则行按正确的顺序排列,因此不必排序。

3.2. 索引例子

  • PCTFREE:为一个块保留的空间百分比,表示数据块在什么情况下可以被insert,默认是10,表示当数据块的可用空间低于10%后,就不可以被insert了,只能被用于update;即:当使用一个block时,在达到pctfree之前,该block是一直可以被插入的,这个时候处在上升期。

3.3. 二分查找

  • 二分查找效率
    • 实体数量:106
    • 每一个实体的大小:8 bytes
    • 每一个磁盘页的大小:2k bytes
      • 一个磁盘页上有250个实体
      • 总共有4000个磁盘页
    • 磁盘查找的效率为: l o g 2 4000 + 1 = 13 log_{2}4000 + 1 = 13 log24000+1=13

3.4. B树中的百万索引实体

3.5. B树结构


  • 秩为3的B树的内部结点

3.6. B+树的性质

  1. 每个节点都是磁盘页面大小的,并且位于磁盘上预先定义好的位置。
  2. 叶级以上的节点包含目录条目,带有(n–1)个分隔键和n个指向较低级B树节点的磁盘指针。
  3. 叶级上的节点包含具有(keyval,ROWID)对的条目,这些对指向已索引的各个行。
  4. 根以下的所有节点至少有一半充满条目信息。
    1. 多次删除后通常不执行此操作。
  5. 根节点至少包含两个条目(一个键值)。
    1. 除非仅索引一行并且根是叶节点。

3.7. 位图索引

  1. 位图索引为每个不同的键值使用一个位图。
  2. 位图代替ROWID列表,指定一组行。
    1. 1:这一行有键值
    2. 0:这一行没有键值

4. 聚集索引和非聚集索引

4.1. 聚集索引

  1. 表的行与索引条目的顺序相同-按键值。
  2. 在大多数数据库产品中,磁盘上数据页上行的默认放置是按加载或插入(堆)的顺序进行的。

4.2. 非聚集索引

5. 哈希主键索引

  1. 使用哈希函数将位于哈希群集中的表中的行放置在伪随机数据页插槽中,并以相同的方式进行查找,通常仅使用一个I / O。
  2. 当然,也不根据键值排序
  3. 连续的键值并不太紧密,可能在完全不同的页面上,依靠哈希函数来确定位置。

5.1. 例子

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
索引是一种数据结构,它可以帮助加快数据库表中数据的检索速度。在 MySQL 数据库中,索引通常被称为 B-tree 索引,它可以加速 SELECT、UPDATE 和 DELETE 操作的速度。在本文中,我们将介绍 MySQL 中的索引,包括索引的类型、如何创建索引、如何使用索引以及索引的优化。 ## 索引的类型 MySQL 支持多种类型的索引,包括以下几种常见的类型: - PRIMARY KEY 索引:用于唯一标识数据库表中的每一行记录。 - UNIQUE 索引:用于确保表中某一列的值是唯一的。 - INDEX 索引:用于加速表中的数据检索操作。 - FULLTEXT 索引:用于全文搜索操作。 ## 如何创建索引 在 MySQL 中,可以使用 CREATE INDEX 语句来创建索引。例如,下面的语句创建一个名为 idx_last_name 的索引,用于加速对 employees 表中 last_name 列的检索: ``` CREATE INDEX idx_last_name ON employees (last_name); ``` 需要注意的是,创建索引可能会增加数据库表的插入、更新和删除操作的时间开销。因此,应该谨慎地考虑是否需要创建索引,以及应该创建哪些索引。 ## 如何使用索引 在 MySQL 中,可以使用 EXPLAIN 语句来查看查询语句的执行计划。如果查询语句使用了索引,则在执行计划中会显示使用的索引名称。例如,下面的语句使用 EXPLAIN 来查看对 employees 表进行 last_name 列检索的执行计划: ``` EXPLAIN SELECT * FROM employees WHERE last_name = 'Smith'; ``` 如果查询语句没有使用索引,则可以使用 FORCE INDEX 语句来强制使用指定的索引。例如,下面的语句强制使用 idx_last_name 索引来对 employees 表进行 last_name 列检索: ``` SELECT * FROM employees FORCE INDEX (idx_last_name) WHERE last_name = 'Smith'; ``` 需要注意的是,强制使用索引可能会导致性能下降。因此,应该仅在必要时使用强制索引。 ## 索引的优化 在 MySQL 中,可以使用 OPTIMIZE TABLE 语句来优化数据库表。优化表可以帮助减少表中的碎片,提高表的查询性能。例如,下面的语句优化 employees 表: ``` OPTIMIZE TABLE employees; ``` 此外,还可以使用 ANALYZE TABLE 语句来分析表中的数据分布情况,以便优化索引。例如,下面的语句分析 employees 表的数据分布情况: ``` ANALYZE TABLE employees; ``` 需要注意的是,索引的性能可能会受到数据分布的影响。如果表中的数据分布不均匀,则可能需要重新设计索引或优化查询语句以提高性能。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值