MySQl索引简介

索引是什么

MySQL官方定义:索引(index)是帮助MySQL高效获取数据的数据结构。即索引是一种数据结构。可以理解为“排好序的快速查找数据结构”。

我们都知道,数据库查询是数据库的最主要功能之一。都希望我们的查询速度尽可能的快,因此数据库系统的设计者会从查询算法进行优化。而最基本的顺序查找,他的时间复杂度是O(n),在数据量很大的时候是最糟的。除此之外还有更优秀的查找算法,比如二分查找、二叉树查找等,但这些算法都只能用在特定的数据结构上。

在数据之外,数据库系统还维护着满足特定查找算法的数据结构,这些数据结构以某种方式引用(指向)数据,这样就可以在这些数据结构上实现高级查找算法,这种数据结构就是索引。


上图展示了一种可能的索引方式。左边是数据表,一共有七条记录,最左边是数据记录的物理地址(逻辑上相邻的记录在磁盘上也不是一定物理相邻)。为了加快Col2的查找,可以维护一个右边所示的二叉查找树,每个节点分别包含索引键值和一个指向对应数据记录物理地址的指针,这样就可以利用二叉查找树在O(log2n)的复杂度内获取到相应的数据。

但在实际的数据库系统中几乎没有使用二叉查找数实现的。目前大部分数据可系统都是采用B-Tree或B+Tree实现的。

索引的优势

  • 类似于大学图书馆建书目索引,提高数据检索的效率,降低数据库的IO成本。
  • 通过索引列对数据进行排序,降低数据排序的成本,降低了CPU的消耗。

索引的劣势

  • 索引列要占用空间,因为索引实际上也是一张表,该表保存了主键与索引字段,并指向实体表的记录。
  • 虽然索引大大提高了查询速度,但同时会降低跟新表的速度,如对表进行INSERT、UPDATE和DELETE。因为跟新表时,MySQL不仅要保存数据,还要保存一下索引文件每次跟新添加了索引列的字段。
  • 索引只是提高效率的一个因素,如果MySQL有大量的表,就需要花时间研究建立最优秀的索引,或优化查询。

索引的分类

  • 单值索引: 一个索引只包含单个列,一个表可以有多个单列索引。
  • 唯一索引: 索引列的值必须唯一,但允许有空值。
  • 复合索引:一个索引包含多个列。

哪些情况适合建索引

  • 主键自动建立唯一索引。
  • 频繁建立查询条件的字段应该创建索引。
  • 查询中与其他表关联的字段,外键关系建立索引。
  • 查询中排序的字段,排序的字段若通过索引去访问将大大提高排序速度。
  • 查询中统计或者分组字段。

哪些情况不适合建索引

  • 频繁更新字段不适合建索引。
  • where条件里用不到的字段不创建索引。
  • 表记录太少。
  • 经常怎删改的表。
  • 如果某个数据列包含许多重复的内容,为他建立索引没有太大的实际效果。

假如一个表有10行记录,有一个字段A只有T和F两种值,且每个值的分布概率大约为50%,那么对于这种表A字段建索引一般不会提高数据库的查询速度。

索引的选择性是指索引列中不同值的数目与表中记录数的比。如果一个表中有2000条记录,表索引列有1980个不同的值,那么这个索引的选择性就是1980/2000=0.99,一个索引的选择性越接近1,这个索引的效率就越高。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值