大体来说,MySQL 可以分为 Server 层和存储引擎层两部分
-
Server 层:
-
连接器、查询缓存、分析器、优化器、执行器
-
所有的内置函数(如时间、日期、数学和加密函数等)
-
所有跨存储引擎的操作,比如存储过程,触发器、视图等
-
-
存储引擎:负责数据的存储和提取,其架构模式是插件式的,支持 InnoDB、MyISAM、Memory 等多个存储引擎。从 MySQL 5.5.5 起成为 MySQL 的默认存储引擎
连接器
连接器负责和客户端建立连接、获取权限、维持为管理连接
连接命令一般为
mysql -h$ip -P$port -u$user -p
连接命令中的 mysql 是客户端工具,用来和服务端建立连接。在完成经典的 TCP 握手后,连接器就开始要认证你的身份,这时候用的就是你输入用户名和密码
-
如果用户名或密码不对,你就会收到一个 “Access denied for user” 的错误,然后客户端程序结束执行。
-
如果用户名密码认证通过,连接器会到权限表里面查出你拥有的权限。之后,这个连接里面的权限判断逻辑,都将依赖此时读到的权限。
这意味着,一个用户建立权限后,即使你用管理员账号对这个用户的权限做了修改,也不会影响已经存在连接的权限。修改完成后,只有再新建的连接才会使用新的权限设置。
连接完成后,如果你没有后续的动作,这个连接就处于空闲状态,可以在 show processlist 命令中看到它。其中 Commoand 列显示为 Sleep 的这一行,就表示现在系统里面有一个空闲连接
连接器自动断开连接的时候是由参数 wait_timeout 控制的,默认值为 8 小时。
可以通过 show variables
命令查看 MySQL 系统变量
show variables like 'wait_timeout'
数据库里面,长连接是指连接成功后,如果客户端持续有请求,则一直使用同一个连接。短连接则是指每次执行完很少的几次查询后就断开连接,下次查询再重新建立一个。
建立连接的过程通常是比较复杂的,推荐尽量使用长连接。
但是,全部使用长连接后,有些时候 MySQL 内存涨得特别快,这是因为 MySQL 在执行过程中临时使用的内存是管理在连接对象里面的。这些资源会在连接断开时才释放。所以如果长连接累积下来,可能导致内存占用太大,被系统杀掉(OOM),从现象上看就是 MySQL 异常重启了。
长连接内存占用问题解决方案
- 定期断开长连接。使用一段时间,或者程序里面判断执行过一个占用内存的大查询后,断开连接,之后要查询再重连
- MySQL 5.7+ 开始,可以在每次执行一个比较大的操作后,通过执行
mysql_reset_connection
来重新初始化连接资源。这个过程不需要重连和重做权限认证,但是会将连接恢复到刚刚创建时的状态。
查询缓存
不建议使用查询缓存,因为查询缓存的失效非常频繁,只要对一个表的更新,这个表上所有的查询缓存都会被清空。
MySQL 8.0 版本直接删掉了整个查询缓存功能。
分析器
从分析器开始就真正的执行 SQL 语句了,分析器负责对 SQL 语句做解析
- 词法分析:SQL 语句是由多个字符串和空格组成的,MySQL 需要识别出里面的字符串分别是什么,代表什么。
- 语法分析:根据词法分析的结果,语法分析器会根据语法规则,判断输入的这个 SQL 语句是否满足 MySQL 语法。如果语句不对,就会收到“You have an error in your SQL syntax”的错误提醒。
优化器
优化器是在表里面有多个索引的时候,决定使用哪个索引;或者在一个语句有多个关联查询的时候,决定各个表的连接顺序。
执行器
MySQL 通过分析器知道了你要做什么,通过优化器知道了该怎么做,于是就进入了执行器阶段,开始执行语句。
开始执行的时候,要先判断你对要操作的表有没又权限,如果没有,会返回没有权限的错误,如果有权限,就打开表继续执行。打开表的时候,执行器会根据表的引擎定义,去使用这个引擎提供的接口。
在数据库的慢查询日志中可以看到一个 row_examined 字段,表示这个语句执行过程中扫描了多少行,这个值是在执行器每次调用引擎获取数据行的时候累加的。
在有些场景下,执行器调用一次,在引擎内部扫描了多行,因此引擎扫描行数和 row_examined 并不是完全相同的。