索引的设计原则
索引覆盖是什么:
索引(在MySQL中也叫做“键(key)”) 是存储引擎用于快速找到记录的一种数据结构。这是索引的基本功能。
索引对于良好的性能非常关键。尤其是当表中的数据量越来越大时,索引对性能的影响跃愈发重要。在数据量较小且负载较低时,不恰当的索引对性能的影响可能还不明显,但是当数据量逐渐增大时,性能则会急剧下降。
一、索引基础
Q1:索引是如何工作的?
A1:要理解MySQL中索引是如何工作的,最简单是方法就是区看一看一本书的目录。倘若想在一本书中找到某个特定命题,一般会先看书的“索引”,找到对应的页码。
那么在MySQL中,存储引擎的用类似的方法使用索引,它先在索引中找到对应值,然后根据匹配的索引记录找到对应的数据行。
Q2:MySQL支持的索引的类型?以及优缺点
A2:B-Tree 索引、哈希索引、空间数据索引、全文索引等其他索引。
- B-Tree通常意味着所有的值都是按顺序存储的,并且每一个叶子页到跟的距离相同。叶子页比较特殊,它的指针指向的是被索引的数据,而不是其他的节点页。
图1 B-Tree (从技术上来说是B+tree)索引树种的部分条目示例
回想BTree的查找操作:进行查找操作时,首先在根节点进行二分查找,找到一个 key 所在的指针,然后递归地在指针所指向的节点进行查 找。直到查找到叶子节点,然后在叶子节点上进行二分查找,找出 key 所对应的 data 。
这也就意味着B-Tree索引能够加快数据的访问速度,因为存储引擎不再需要进行全表扫描来获取需要的数据,取而代之的是从索引的根节点开始进行搜索。根节点的槽中存放了指向子节点的指针,存储引擎很具这些指针向下层查找。通过比较节点页的值和要查找的值可以找到合适的指针进入下层子节点,这些指针实际上定义了节点页中的上限和下限。
那么有哪些可以使用B-Tree索引的查询类型:
(1)全值匹配:
(2)匹配最左前缀
(3)匹配列前缀
(4)匹配范围值
(5)精确匹配某一列并范围匹配另外一列
(6)只范围跟索引的查询
除了上述适用之外,它也存在局限性:
(1)如果不是按照索引的最左列开始查找,那么无法使用索引
(2)不能跳过索引中的列
(3)如果查询中有某个列的范围查询,则其右边所有列都无法使用索引优化查询。
哈希索引基于哈希表实现,只有精确匹配索引所有列的查询才有效。对于每一行数据,存储引擎都会对所有的索引列计算一个哈希码。哈希索引将所有的哈希码存储在索引中,同时在哈希表中保存指向每个数据行的指针。
限制之处:
(1)哈希索引只包含哈希值和行指针,而不存储字段值。
(2)哈希索引数据不是按照索引值的顺序排序的,所以无法用于排序。
(3)不支持部分索引列匹配查找。
(4)只支持等值比较查询
(5)哈希冲突多的话,索引维护操作的代价也会很高。
空间数据索引(R-Tree)
MyISAM 表支持空间索引,可以用作地理数据存储。这类索引无须前缀查询。空间索引会从所有维度来索引数据。这一类型索引,接触的很少,以后碰到再做详细总结。
全文索引,这是一种特殊类型的索引,它查找的是文本中的关键词。
知识点: