MySQL介绍
MySQL是目前非常流行的开源关系型数据库,不仅是免费的,可靠性高,速度也比较快,而且拥有灵活的插件式存储引擎。
MySQL是一个C/S模型,启动MySQL后,本地会启动mysqld服务进程,客户端通过mysql连接服务器,进行数据存储查询。
存储引擎
存储引擎是数据库系统管理数据,存储数据的核心方法,MySQL核心就是插件式存储引擎,支持多种存储引擎,本文主要介绍两种存储引擎:MyISAM、InnoDB。MySQL在5.58版本之前默认使用MyISAM,从5.58开始默认使用InnoDB,这两种存储引擎最大的区别有两点:
1.索引不同
2.MyISAM不支持事务,InnoDB支持事务
索引
官方对索引的定义为:索引(Index)是帮助MySQL高效获取数据的数据结构
MySQL中常用的索引结构在物理上分为两类:BTree索引和哈希索引
本次主要介绍BTree索引
BTree索引
B树是一种高效的多叉搜索树,当为M叉时具有以下性质:
- 根结点至少有两个孩子
- 每个中间节点(非根,非叶子)包含k-1个键值和k个孩子,M/2 <= K <= M
- 每个叶子节点都包含k-1个键值,M/2 <= k <= M
- 所有叶子节点位于同一层
- 每个节点中的元素升序排列
数据库的巧妙设计:B树节点申请一页空间,里面存放键值、磁盘物理地址、孩子节点指针,当查找数据时,通过键值确定子节点,利用子节点获取下一个磁盘地址,再通过键值定位表中数据,B树的高度就是磁盘I/O的次数,所以B树的核心思想就是压缩树的高度
B树的缺点
每个节点空间不可能无限大,如果数据过大,就会导致键值个数减少,增加磁盘I/O次数,降低查找效率
B+Tree索引
B+树是B树的一种变形,B+树索引相比于B树索引,有以下几个改变:
- 键值数与子节点数相同
- 非叶子节点不再存放数据
- 叶子节点增加了顺序访问指针
非叶子节点不再存放数据,大大增加了键值的个数,叶子节点增加顺序指针,便于顺序扫描,提升了区间查找效率,相比于B树,B+树更适合作为查询结构
MyISAM索引实现
MyISAM引擎使用B+树索引,叶子节点存放数据地址,即数据与索引分离,这种索引叫做非聚合索引
辅助索引与主索引基本相同,主索引key唯一,辅助索引key可以重复
InnoDB索引实现
InnoDB引擎使用B+树索引,但与MyISAM天差地别
第一个差别:MyISAM索引数据与索引分离,索引文件仅保存数据记录的地址。而InnoDB中,叶子节点保存了完整的数据
由图可见,数据与索引聚合,这种索引叫做聚合索引,叶子节点中的key就是表中主键,所以InnoDB要求表必须有主键(MyISAM可以没有),如果没有显式指定,则MySQL系统会自动选择一个可以唯一标识数据记录的列作为主键,如果不存在这种列,则MySQL自动为InnoDB表生成一个隐含字段作为主键,这个字段长度为6个字节,类型为长整形。
第二个差别:InnoDB中的辅助索引存储主键的值,而不是地址
通过辅助索引查找,需要查找两次:
- 找到主键索引的值key
- 通过key在主索引中查找数据
本文完~
巨人的肩膀:http://blog.codinglabs.org/articles/theory-of-mysql-index.html