MYSQL 执行流程

本文详细介绍了MySQL的执行过程,包括连接器的身份验证与权限验证、缓存的使用、分析器的语法解析、优化器的执行计划选择以及执行器的存储引擎操作。此外,还阐述了SQL的执行顺序,从FROM、JOIN ON、WHERE、GROUP BY、HAVING、SELECT、DISTINCT、ORDER BY到LIMIT的步骤,并解释了每个阶段的作用。理解这些概念有助于优化SQL语句和提升数据库性能。
摘要由CSDN通过智能技术生成

一 执行过程:

MYSQL 执行流程

1.1: 连接器

连接器的主要职责就是:

  1.  负责与客户端的通信,是半双工模式,这就意味着某一固定时刻只能由客户端向服务器请求或者服务器向客户端发送数据,而不能同时进行,其中mysql在与客户端连接TC/IP的.

  2.  验证请求用户的账户和密码是否正确,如果账户和密码错误,会报错:Access denied for user 'root'@'localhost' (using password: YES).

  3.  如果用户的账户和密码验证通过,会在mysql自带的权限表中查询当前用户的权限:
    mysql中存在4个控制权限的表,分别为user表,db表,tables_priv表,columns_priv表,mysql权限表的验证过程为:

    1. User表:存放用户账户信息以及全局级别(所有数据库)权限,决定了来自哪些主机的哪些用户可以访问数据库实例.
    2. Db表 : 存放数据库级别的权限,决定了来自哪些主机的哪些用户可以访问此数据库.
    3. Tables_priv表 :存放表级别的权限,决定了来自哪些主机的哪些用户可以访问数据库的这个表.
    4. Columns_priv表 :存放列级别的权限,决定了来自哪些主机的哪些用户可以访问数据库表的这个字段 .
    5. Procs_priv表 :存放存储过程函数级别的权限.
  4.  先从user表中的Host,User,Password这3个字段中判断连接的ip、用户名、密码是否存在,存在则通过验证。

  5.  通过身份认证后,进行权限分配,按照userdbtables_privcolumns_priv 的顺序进行验证。即先检查全局权限表user,如果user中对应的权限为Y,则此用户对所有数据库的权限都为Y,将不再检查db, tables_priv,columns_priv;如果为N,则到db表中检查此用户对应的具体数据库,并得到db中为Y的权限;如果db中为N,则检查tables_priv中此数据库对应的具体表,取得表中的权限Y,以此类推

  6.  如果在任何一个过程中权限验证不通过,都会报错

1.2: 缓存

 mysql的缓存主要的作用是为了提升查询的效率,缓存以key和value的哈希表形式存储,key是具体的sql语句,value是结果的集合。

 如果无法命中缓存,就继续走到分析器的的一步,如果命中缓存就直接返回给客户端 。不过需要注意的是在mysql的8.0版本以后,缓存被官方删除掉了。

之所以删除掉,是因为查询缓存的失效非常频繁,如果在一个写多读少的环境中,缓存会频繁的新增和失效。

 对于某些更新压力大的数据库来说,查询缓存的命中率会非常低,mysql为了维护缓存可能会出现一定的伸缩性的问题,目前在5.6的版本中已经默认关闭了,比较推荐的一种做法是将缓存放在客户端,性能大概会提升5倍左右

1.3: 分析器

 分析器的主要作用是将客户端发过来的sql语句进行分析,这将包括预处理与解析过程,在这个阶段会解析sql语句的语义,并进行关键词和非关键词进行提取、解析,并组成一个解析树。
具体的关键词包括不限定于以下:

select/update/delete/or/in/where/group by/having/count/limit等。

 如果分析到语法错误,会直接给客户端抛出异常: ERROR : You have an error in your SQL syntax

比如:select * from user where userId =1234;

 在分析器中就通过语义规则器将select from where这些关键词提取和匹配出来,mysql会自动判断关键词和非关键词,将用户的匹配字段和自定义语句识别出来。

 这个阶段也会做一些校验:比如校验当前数据库是否存在user表,同时假如User表中不存在userId这个字段同样会报错:unknown column in field list.

1.4: 优化器

  1.  能够进入到优化器阶段表示sql是符合mysql的标准语义规则的并且可以执行的,此阶段主要是进行sql语句的优化,会根据执行计划进行最优的选择,匹配合适的索引,选择最佳的执行方案。
  2.  比如一个典型的例子是这样的:

表T,对A、B、C列建立联合索引,在进行查询的时候,当sql查询到的结果是:select xx where B=x and A=x and C=x.很多人会以为是用不到索引的,但其实会用到,虽然索引必须符合最左原则才能使用,但是本质上,优化器会自动将这条sql优化为 : where A=x and B=x and C=X,这种优化会为了底层能够匹配到索引,同时在这个阶段是自动按照执行计划进行预处理,mysql会计算各个执行方法的最佳时间,最终确定一条执行的sql交给最后的执行器。

  1.  优化器并不关心表使用的是什么存储引擎,但存储引擎对于优化查询是有影响的。

1.5: 执行器

 在执行器的阶段,此时会调用存储引擎的API,API会调用存储引擎,主要有以下存储的引擎,不过常用的还是myisaminnodb:
在这里插入图片描述

 引擎以前的名字叫做 : 表处理器(其实这个名字我觉得更能表达它存在的意义)负责对具体的数据文件进行操作,对sql的语义比如select或者update进行分析,执行具体的操作。

 在执行完以后会将具体的操作记录到binlog中,需要注意的一点是: select不会记录到binlog中,只有update/delete/insert才会记录到binlog中 , 而update会采用两阶段提交的方式,都记录redolog中。

二:执行的状态

 可以通过命令 : show full processlist , 展示所有的处理进程 , 主要包含了以下的状态,表示服务器处理客户端的状态,状态包含了从客户端发起请求到后台服务器处理的过程,包括加锁的过程、统计存储引擎的信息,排序数据、搜索中间表、发送数据等。囊括了所有的mysql的所有状态,其中具体的含义如下图:
在这里插入图片描述

三: sql的执行顺序

 事实上,sql并不是按照我们的书写顺序来从前往后、左往右依次执行的,它是按照固定的顺序解析的,主要的作用就是从上一个阶段的执行返回结果来提供给下一阶段使用,sql在执行的过程中会有不同的临时中间表,一般是按照如下顺序:
在这里插入图片描述

 例子:select distinct s.id from T t join S s on t.id=s.id where t.name="Yrion" group by t.mobile having count(*)>2 order by s.create_time limit 5;

3.1:from

 第一步就是选择出from关键词后面跟的表,这也是sql执行的第一步:表示要从数据库中执行哪张表。

实例说明 : 在这个例子中就是首先从数据库中找到表T。

3.2: join on

join 是表示要关联的表,on 是连接的条件。

 通过fromjoin on 选择出需要执行的数据库表 T 和 S ,产生笛卡尔积,生成 T 和 S 合并的临时中间表 temp1。

on: 确定表的绑定关系,通过on 产生临时中间表 temp2

 实例说明 :找到表 S ,生成临时中间表 temp1,然后找到表 T 的 id 和 S 的 id 相同的部分组成成表 temp2 , temp2 里面包含着 T 和 Sid 相等的所有数据。

3.3: where

where表示筛选,根据where后面的条件进行过滤,按照指定的字段的值(如果有and连接符会进行联合筛选)从临时中间表temp2中筛选需要的数据,注意如果在此阶段找不到数据,会直接返回客户端,不会往下进行.这个过程会生成一个临时中间表temp3。注意在where不可以使用聚合函数,聚合函数主要是(min\max\count\sum等函数)。

 实例说明 : 在 temp2 临时表集合中找到 T 表的 name=“Yrion” 的数据,找到数据后会成临时中间表 temp3 , temp3 里包含 name 列为 “Yrion” 的所有表数据。

3.4: group by

group by 是进行分组,对where条件过滤后的临时表temp3按照固定的字段进行分组,产生临时中间表temp4,这个过程只是数据的顺序发生改变,而数据总量不会变化,表中的数据以组的形式存在。

 实例说明 : 在 temp3 表数据中对 mobile 进行分组,查找出 mobile 一样的数据,然后放到一起,产生temp4 临时表。

3.5: Having

 对临时中间表 temp4 进行聚合,这里可以为 count 等计数,然后产生中间表 temp5,在此阶段可以使用 select中的别名。

 实例说明 : 在 temp4 临时表中找出条数大于2的数据,如果小于2直接被舍弃掉,然后生成临时中间表 temp5。

3.6: select

 对分组聚合完的表挑选出需要查询的数据,如果为*会解析为所有数据,此时会产生中间表temp6

 实例说明:在此阶段就是对 temp5 临时聚合表中 S 表中的 id 进行筛选产生temp6 ,此时temp6 就只包含有s表的 id 列数据,并且 name=“Yrion”,通过 mobile 分组数量大于 2 的数据。

3.7: Distinct

distinct 对所有的数据进行去重,此时如果有minmax函数会执行字段函数计算,然后产生临时表 temp7。

 实例说明 : 此阶段对 temp5 中的数据进行去重,引擎API会调用去重函数进行数据的过滤,最终只保留id第一次出现的那条数据,然后产生临时中间表 temp7

3.8: order by

 会根据 temp7 进行顺序排列或者逆序排列,然后插入临时中间表 temp8,这个过程比较耗费资源。

 实例说明:这段会将所有 temp7 临时表中的数据按照创建时间(create_time)进行排序,这个过程也不会有列或者行损失。

3.9: limit

limit对中间表 temp8 进行分页,产生临时中间表temp9,返回给客户端。

 实例说明 : 在 temp7 中排好序的数据,然后取前五条插入到 temp9 这个临时表中,最终返回给客户端。

 ps : 实际上这个过程也并不是绝对这样的,中间mysql会有部分的优化以达到最佳的优化效果,比如在select筛选出找到的数据集。

四: 总结

 本篇博客总结了mysql的执行过程,以及sql的执行顺序,理解这些有助于我们对sql语句进行优化,以及明白mysql中的sql语句从写出来到最终执行的轨迹,有助于我们对sql有比较深入和细致的理解,提高我们的数据库理解能力。同时,对于复杂sql的执行过程、编写都会有一定程度的意义。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值