REVIEW 在MySQL体系架构概述中,MySQL内部的层次之间的关系由上至下大致是这样:
建立连接->SQL语句被发送后->经过解析->进行查询优化,制定查询计划->执行引擎和存储引擎交互->存储引擎和系统文件层进行交互。
一、运行机制:连接机制
建立连接:通过客户端与服务端通信协议与MySQL建立通信连接。MySQL客户端与服务端的通信方式是半双工通信,对于每一个MySQL的连接,时刻都有一个线程状态来标识这个连接正在做什么。
//线程状态:
show processlist;//查看正在运行的线程信息,root用户查看所有人,其他只查看自己
kill id;//干掉线程id
一些参数:
id:线程ID,可以使用kill id;
user:使用这个线程的用户。
Host:发送请求的客户端的IP和端口号。
db:当前命令在哪个库执行。
command:该线程正在执行的操作命令。(create/drop/execute/close stmt/query/sleep/quit/shutdown)
time:表示该线程处于这种状态的时间。(s)
state:线程状态,可以用于判断操作执行是否正常。(updating/sleeping/starting/checking table/closing table/locked/sending data)
info:记录线程执行的语句。默认显示前100个字符。
二、查询缓存机制
查询缓存:这是MySQL可优化查询的一个地方,如果开启了查询缓存且在查询缓存中发现了完全相同的SQL语句,则将查询结果直接返回给客户端,如果开启了查询缓存&&在查询缓存过程中没有发现完全相同的SQL语句->由解析器进行语法语意解析,并生成解析树。
缓存select查询的结果和SQL语句;执行select查询时,先查询缓存,判断是否存在可用的记录集,要求是否完全相同,(包括参数值),这样才会匹配缓存数据命中。
show variables like "%query_cacahe%";//通过该语句可以查询查询缓存是否开启
show status like '%Qcache%'//查询缓存状态参数
即使开启查询缓存,以下查询也不会被缓存:
SQL_NO_CACHE;查询结果大于query_cache_limit设置;查询结果有一些不确定的参数比如now();
三、解析和优化机制
解析器:主要实现SQL语句的解析(在没有命中缓存时生成解析树)。预处理器根据一些规则进一步检查解析树是否合法,比如:检查数据表和数据列是否存在,检查别名和名字是否有歧义,最后生成新的解析树。(等价变换策略 & 基于联合索引,调整条件位置 & 优化count、min、max & 提前中止查询 & in优化)
InnoDB的min只需要寻找索引树最左边的,max只需要找索引树最右边的。
MyISAM的count不需要计算,直接返回结果(内部引擎进行了优化)。
MySQL在进行in查询时会先进行排序,再进行二分查找。
查询优化器:根据解析树形成最优的执行计划。MySQL使用很多优化策略形成最优的执行计划,可以分为两类: 静态优化(编译时优化)和动态优化(运行时优化)。
四、执行引擎机制
查询执行引擎负责还行SQL语句,此时查询执行引擎会根据SQL语句中表的存储引擎类型,以及对应的API接口和底层存储引擎缓存或物理文件的交互,得到查询结果并返回给客户端。若开启查询缓存,这时会将SQL语句和结果完整地保存在Buffer&Cache中,以后若有相同的SQL语句直接返回结果。
如果开启了查询缓存,先将查询结果做缓存操作。返回结果过多,采用增量模式返回。