mysql+5.6+左连接_第5章 索引与算法

5.1 InnoDB存储引擎索引概述

InnoDB常见支持:B+树索引、全文索引、哈希索引。

B+树索引并不能找到一个给定键值的具体行,只能找到被查的数据所在的页。然后数据库通过把页读入到内存,再在内存中进行查找,最后得到数据。

5.2 数据结构与算法

二叉查找树:左子树键值总小于根的键值,右子树的键值大于根节点键值。

二叉查找树可能会退化为链表。

平衡二叉树:符合二叉查找树定义,并且满足任何节点的两个子树高度最大差值为1。

B树:平衡多路查找树

B+树:在B树基础上,将叶子节点使用双向链表进行连接。

5.4 B+树索引

B+树索引可分为:聚集索引、辅助索引。不管聚集索引还是辅助索引,内部都是一个B+树,叶子节点存放着所有的数据。聚集索引与辅助索引不同的是,叶子节点存放的是否是一整行的信息。聚集索引

聚集索引按照每张表的主键构建一颗B+树,同时叶子节点存放的整张表的行记录数据,将聚集索引的叶子节点称为数据页。同B+树一样每个数据页都通过一个双向链表来进行链接。

由于实际数据页只能按照一棵B+树进行排序,因此每张表只能有一个聚集索引。查询优化器倾向采用聚集索引,因为聚集索引能在B+树叶子节点直接找到数据。聚集索引能够特别快的访问按照逐渐排序和范围的查找。辅助索引

辅助索引,又称非聚集索引,叶子节点不包含行记录的全部数据。每个叶子节点包含一个书签,用来高速InnoDB存储引擎去哪找的索引对应的行数据。这个书签就是行数据的聚集索引的键,即主键。

通过辅助索引查找数据时,InnoDB会遍历辅助索引并通过叶级别的指针获得指向主键索引的主键,然后通过主键查找完整的行记录。

每张表辅助索引可有多个。

5.5 Cardinality值

Cardinality表示索引中不重复记录数量的预估值。

5.6 B+树索引的使用

联合索引也是一棵B+树,不同的是联合索引兼职的数量不是1而是大于等于2。

联合索引基于最左匹配原则进行索引使用。

InnoDB支持索引覆盖,即从辅助索引中就可以查找到记录,而不需要查询聚集索引中的记录。比如,辅助索引叶子节点只存储了行数据的主键,对于只查主键的情况,就可以使用辅助索引查询到数据。减少了IO操作,对于统计问题查询的快。

范围查找或者join连接操作等情况下,即使有索引也可能不使用索引进行查找。

5.7 哈希算法

InnoDB使用哈希算法对字典进行查找,冲突机制采用链表方式,哈希函数采用除法散列的方式。

自适应哈希索引由存储引擎控制。

5.8 全文检索

全文检索:将存储于数据库中的所有数据中的任意内容查找出来的技术。

全文检索通常采用倒排索引来实现。倒排索引也是一种索引结构,它在辅助表中存储了单词与单词自身在一个或者多个文档中所在的位置之间的映射。通常使用关联数组实现,有两种表现形式:inverted file index,表现形式:{单词,单词所在的文档ID}

full inverted index, 表现形式:{单词,(单词所在的文档,在具体文档中的位置)}

InnoDB全文检索:采用full inverted index方式,InnoDB中将(DocumentId,Position)视为一个“ilist”。因此在全文检索表中有2列,一个是word字段,一个是ilist字段,并在word字段上设置索引。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值