MySQL优化-存储引擎和逻辑架构及工作流程

最新推荐文章于 2021-03-18 02:35:37 发布

郭子ABC

最新推荐文章于 2021-03-18 02:35:37 发布

阅读量263

点赞数

分类专栏： MySQL

本文链接：https://blog.csdn.net/weixin_39710170/article/details/103947088

版权

MySQL 专栏收录该内容

4 篇文章 0 订阅

订阅专栏

存储引擎介绍

存储引擎在MySQL的逻辑架构中位于第三层，负责MySQL中的数据的存储和提取。MySQL存储引擎有很多，不同的存储引擎保存数据和索引的方式是不同的。每一种存储引擎都有它的优势和劣势。首先我们先看一下MySQL逻辑架构图。

MySQL逻辑架构图

首先，我们对该图中的各个模块做一简单介绍：

Connectors：指的是不同语言中与SQL的交互。
Connection Pool：管理缓冲用户连接，线程处理等需要缓存的需求。负责监听对 MySQL Server 的各种请求，接收连接请求，转发所有连接请求到线程管理模块。每一个连接上 MySQL Server 的客户端请求都会被分配（或创建）一个连接线程为其单独服务。而连接线程的主要工作就是负责 MySQL Server 与客户端的通信，接受客户端的命令请求，传递 Server 端的结果信息等。线程管理模块则负责管理维护这些连接线程。包括线程的创建，线程的 cache 等。
Management Serveices & Utilities：系统管理和控制工具。
SQL Interface：接受用户的SQL命令，并且返回用户需要查询的结果。
Parser：SQL命令传递到解析器的时候会被解析器验证和解析。解析器是由Lex和YACC实现的，是一个很长的脚本。在 MySQL中我们习惯将所有 Client 端发送给 Server 端的命令都称为 query ，在 MySQL Server 里面，连接线程接收到客户端的一个 Query 后，会直接将该 query 传递给专门负责将各种 Query 进行分类然后转发给各个对应的处理模块。主要功能： a.将SQL语句进行语义和语法的分析，分解成数据结构，然后按照不同的操作类型进行分类，然后做出针对性的转发到后续步骤，以后SQL语句的传递和处理就是基于这个结构的； b.如果在分解构成中遇到错误，那么就说明这个sql语句是不合理的。
Optimizer:

查询优化器：SQL语句在查询之前会使用查询优化器对查询进行优化。就是优化客户端请求query，根据客户端请求的 query 语句，和数据库中的一些统计信息，在一系列算法的基础上进行分析，得出一个最优的策略，告诉后面的程序如何取得这个 query 语句的结果。

　　使用的是“选取-投影-联接”策略进行查询：

用一个例子就可以理解： select uid,name from user where gender = 1;

这个select 查询先根据where 语句进行选取，而不是先将表全部查询出来以后再进行gender过滤；然后根据uid和name进行属性投影，而不是将属性全部取出以后再进行过滤。最后将这两个查询条件联接起来生成最终查询结果。
Cache和Buffer:

查询缓存：主要功能是将客户端提交给MySQL 的 Select 类 query 请求的返回结果集 cache 到内存中，与该 query 的一个 hash 值做一个对应。该 query 所取数据的基表发生任何数据的变化之后， MySQL 会自动使该 query 的Cache 失效。在读写比例非常高的应用系统中， Query Cache 对性能的提高是非常显著的。当然它对内存的消耗也是非常大的。

　　如果查询缓存有命中的查询结果，查询语句就可以直接去查询缓存中取数据。这个缓存机制是由一系列小缓存组成的。比如表缓存，记录缓存，key缓存，权限缓存等。
存储引擎接口:

MySQL区别于其他数据库的最重要的特点就是其插件式的表存储引擎。MySQL插件式的存储引擎架构提供了一系列标准的管理和服务支持，这些标准与存储引擎本身无关，可能是每个数据库系统本身都必需的，如SQL分析器和优化器等，而存储引擎是底层物理结构的实现，每个存储引擎开发者都可以按照自己的意愿来进行开发。

注意：存储引擎是基于表的，而不是数据库。

数据库的工作流程

面我们下来介绍一下数据库具体的工作流程，先看一张图：

在这里，我从数据库架构的三个层面分别介绍数据库的工作流程：

最上层：客户端连接

1、连接处理：客户端同数据库服务层建立TCP连接，连接管理模块会建立连接，并请求一个连接线程。如果连接池中有空闲的连接线程，则分配给这个连接，如果没有，在没有超过最大连接数的情况下，创建新的连接线程负责这个客户端。

２、授权认证：在真正的操作之前，还需要调用用户模块进行授权检查，来验证用户是否有权限。通过后，方才提供服务，连接线程开始接收并处理来自客户端的SQL语句。

第二层：核心服务

1、连接线程接收到SQL语句之后，将语句交给SQL语句解析模块进行语法分析和语义分析。

2、如果是一个查询语句，则可以先看查询缓存中是否有结果，如果有结果可以直接返回给客户端。

3、如果查询缓存中没有结果，就需要真的查询数据库引擎层了，于是发给SQL优化器，进行查询的优化。如果是表变更，则分别交给insert、update、delete、create、alter处理模块进行处理。

第三层：数据库引擎层

1、打开表，如果需要的话获取相应的锁。

2、先查询缓存页中有没有相应的数据，如果有则可以直接返回，如果没有就要从磁盘上去读取。

3、当在磁盘中找到相应的数据之后，则会加载到缓存中来，从而使得后面的查询更加高效，由于内存有限，多采用变通的LRU表来管理缓存页，保证缓存的都是经常访问的数据。

最后，获取数据后返回给客户端，关闭连接，释放连接线程。

InnoDB存储引擎

nnoDB是默认的事务型存储引擎，也是最重要，使用最广泛的存储引擎。在没有特殊情况下，一般优先使用InnoDB存储引擎。

数据存储形式：使用InnoDB时，会将数据表分为.frm 和 idb两个文件进行存储。
锁的粒度：InnoDB采用MVCC(多版本并发控制)来支持高并发，InnoDB实现了四个隔离级别，默认级别是REPETABLE READ，并通过间隙锁策略防止幻读的出现。它的锁粒度是行锁。
事务：nnoDB是典型的事务型存储引擎，并且通过一些机制和工具，支持真正的热备份。
数据的存储特点：InnoDB表是基于聚簇索引建立的，聚簇索引对主键的查询有很高的性能，不过他的二级索引（非主键索引）必须包含主键列，索引其他的索引会很大。

MyISAM存储引擎

数据存储形式：MyISAM采用的是索引与数据分离的形式，将数据保存在三个文件中.frm.MYD,.MYIs。
锁的粒度：MyISAM不支持行锁，所以读取时对表加上共享锁，在写入是对表加上排他锁。由于是对整张表加锁，相比InnoDB，在并发写入时效率很低。
事务：MyISAM不支持事务。
数据的存储特点：MyISAM是基于非聚簇索引进行存储的。
其他：MyISAM提供了大量的特性，包括全文索引，压缩，空间函数，延迟更新索引键等。进行压缩后的表是不能进行修改的，但是压缩表可以极大减少磁盘占用空间，因此也可以减少磁盘IO，从而提供查询性能。全文索引，是一种基于分词创建的索引，可以支持复杂的查询。延迟更新索引键，不会将更新的索引数据立即写入到磁盘，而是会写到内存中的缓冲区中，只有在清除缓冲区时候才会将对应的索引写入磁盘，这种方式大大提升了写入性能。

对比与选择

两种存储引擎各有各的有点，MyISAM专注性能，InnoDB专注事务。两者最大的区别就是InnoDB支持事务，和行锁。

如何在两种存储引擎中进行选择？

① 是否有事务操作？有，InnoDB。

②是否存储并发修改？有，InnoDB。

③是否追求快速查询，且数据修改较少？是，MyISAM。

④是否使用全文索引？如果不引用第三方框架，可以选择MyISAM，但是可以选用第三方框架和InnDB效率会更高。

浅谈MVCC

MySQL大多数事务型存储引擎实现的都不是简单的行锁。基于提升并发性能的考虑，他们一般都同时实现了多版本并发控制(MVCC)。

可以认为MVCC是行级锁的一个变种，它能在大多数情况下避免加锁操作，因此开销更低。无论怎样实现，它们大豆实现了非阻塞的读操作，写操作也只锁定制定的行。

MVCC是通过保存数据在某一个时间点的快照来实现的，也就是说无论事务执行多久，每个事务看到的数据都是一致的。InnoDB的MVCC，是通过在每行记录后面保存两个隐藏的列来实现，这两个列一个保存了行的创建时间，一个保存了行的过期时间(或删除时间)，当然，并非存储的是时间，而是系统版本号。每开启一个事务，版本号都会递增，事务开始时刻的系统版本号会作为事务的版本号。

id	name	创建时间（行版本号）	删除时间(删除版本号)
1	Mary	1	null
2	Jann	1	null

以InnoDB存储引擎的的REPEATABLE READ隔离级别来说：

SELECT

①只查询创建时间版本号小于当前事务版本号的数据行（保证事务读取的行要么在事务开始之前就存在，要么是事务本身插入的行）

②行的删除版本号要么未定义，要么大于当前事务版本号，这样可以确保事务读取到的行，在开始事务之前未被删除

只有复合上诉两个条件的记录才会作为结果返回

INSERT

为插入的数据保存当前系统版本号作为行版本号

DELETE

保存当前系统版本号作为删除行版本号

UPDATE

插入一行数据，并将当前系统版本号赋予行版本号；同事保存当前系统版本号到原来的行作为删除版本号。

注：MVCC只在REPEATABLE和READ COMMITTED两个隔离级别下才能正常工作。

————————————————

原文链接：https://blog.csdn.net/z_ryan/article/details/82260663

原文链接：https://www.cnblogs.com/liqiangchn/p/9066686.html

郭子ABC

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
MySQL优化-存储引擎和逻辑架构及工作流程

存储引擎介绍存储引擎在MySQL的逻辑架构中位于第三层，负责MySQL中的数据的存储和提取。MySQL存储引擎有很多，不同的存储引擎保存数据和索引的方式是不同的。每一种存储引擎都有它的优势和劣势。首先我们先看一下MySQL逻辑架构图。MySQL逻辑架构图首先，我们对该图中的各个模块做一简单介绍：Connectors：指的是不同语言中与SQL的交互。 Connection ...
复制链接

扫一扫

专栏目录