MySQL逻辑架构
架构分层
总体上,我们可以把 MySQL 分成三层,跟客户端对接的连接层,真正执行操作的服务层,和跟硬件打交道的存储引擎层(参考 MyBatis:接口、核心、基础)
连接层
我们的客户端要连接到 MySQL 服务器 3306 端口,必须要跟服务端建立连接,那么管理所有的连接,验证客户端的身份和权限,这些功能就在连接层完成
服务层
连接层会把 SQL 语句交给服务层,这里面又包含一系列的流程:比如查询缓存的判断、根据 SQL 调用相应的接口,对我们的 SQL 语句进行词法和语法的解析(比如关键字怎么识别,别名怎么识别,语法有没有错误等等)
然后就是优化器,MySQL 底层会根据一定的规则对我们的 SQL 语句进行优化,最后再交给执行器去执行
mysql 服务层
查询缓存
MySQL 内部自带了一个缓存模块。mysql的缓存实现的不太好,不推荐使用,8.0+版本已经去掉了缓存模块
语法解析和预处理(Parser & Preprocessor)
为什么一条 SQL 语句能够被识别呢?假如我随便执行一个字符串 penyuyan,服务器报了一个 1064 的错:
[Err] 1064 - You have an error in your SQL syntax; check the manual that corresponds to your MySQL server version for theright syntax to use near 'penyuyan' at line 1
它是怎么知道我输入的内容是错误的?
这个就是 MySQL 的 Parser 解析器和 Preprocessor 预处理模块,这一步主要做的事情是对语句基于 SQL 语法进行词法和语法分析和语义的解析
词法解析
词法分析就是把一个完整的 SQL 语句打碎成一个个的单词
比如一个简单的 SQL 语句:
select name from user where id = 1;
它会打碎成 8 个符号,每个符号是什么类型,从哪里开始到哪里结束。
我们自定义ORM框架的时候,也会需要用到SQL的组装
语法解析
第二步就是语法分析,语法分析会对 SQL 做一些语法检查,比如单引号有没有闭合,然后根据 MySQL 定义的语法规则,根据 SQL 语句生成一个数据结构。这个数据结构我们把它叫做解析树(select_lex)
任何数据库的中间件,比如 Mycat,Sharding-JDBC,都必须要有词法和语法分析功能,在市面上也有很多的开源的词法解析的工具(比如 LEX,Yacc)
预处理器
问题:如果我写了一个词法和语法都正确的 SQL,但是表名或者字段不存在,会在哪里报错?是在数据库的执行层还是解析器?
比如:select * from penyuyan;
解析器可以分析语法,但是它怎么知道数据库里面有什么表,表里面有什么字段呢?
实际上还是在解析的时候报错,解析 SQL 的环节里面有个预处理器。它会检查生成的解析树,解决解析器无法解析的语义。比如,它会检查表和列名是否存在,检查名字和别名,保证没有歧义。预处理之后得到一个新的解析树
优化器(Query Optimizer)与查询执行计划
一条 SQL 语句是不是只有一种执行方式?或者说数据库最终执行的 SQL 是不是就是我们发送的 SQL?
答案是否定的。一条 SQL 语句是可以有很多种执行方式的,最终返回相同的结果,这些执行方式怎么得到的?最终选择哪一种去执行?根据什么判断标准去选择?
这个就是 MySQL 的查询优化器的模块的 功能。查询优化器的目的就是根据解析树,去生成不同的执行计划(Execution Plan),然后选择一种最优的执行计划,MySQL 使用基于开销(cost)的优化器,那种执行计划开销最小,就用哪种
可以使用这个命令查看查询的开销:
show status like 'Last_query_cost';
MySQL 的优化器能处理哪些优化类型呢?
举两个简单的例子:
1、当我们对多张表进行关联查询的时候,以哪个表的数据作为基准表
2、有多个索引可以使用的时候,选择哪个索引
优化器得到的结果
优化完之后,得到一个什么东西呢?优化器最终会把解析树变成一个查询执行计划,查询执行计划是一个数据结构。
当然,这个执行计划也不一定是最优的执行计划呢?,因为 MySQL 也有可能覆盖不到所有的执行计划。
我们怎么查看 MySQL 的执行计划呢?比如多张表关联查询,先查询哪张表?在执行查询的时候可能用到哪些索引,实际上用到了什么索引?
使用explain命令就可以看到:
EXPLAIN select name from user where id=1;
得到了执行计划之后就可以交给存储引擎执行了
存储引擎
查看存储引擎命令:
show create table vc_user;
存储引擎就是我们的数据真正存放的地方,在 MySQL 里面支持不同的存储引擎。再往下就是内存或者磁盘