MySQL逻辑架构与相关知识 ———>《高性能MySQL》

MySQL逻辑架构

如果能在脑海中构建一副MySQL各组件之间如何协同工作的,架构图,就会有助于深入理解MySQL服务器。

1.MySQL逻辑架构展示

最上层的服务并不是MySQL独有的,大多数基于网络的客户端/服务器工具或者服务都有类似的架构,比如连接服务器,授权认证,安全认证等等。

第二层架构是MySQL比较有意思的部分,大多数MySQL的核心功能都在这一层,包括查询解析,分析,优化,缓存以及所有的内置函数(例如:日期,时间,数学和加密函数),所有跨存储引擎的功能都在这一层实现:存储过程,触发器,视图等。

第三层包含了存储引擎。存储引擎服务MySQL中数据的存储和提取,和不同的文件系统一样,每个存储引擎都有各自的优势。服务器通过API与存储引擎通信,这些借口屏蔽了不同存储引擎之间的差异,使得这些差异对上层的查询过程透明。存储引擎包含了几十个底层函数,用户执行诸如“开始一个事物” 或者 “根据主键提取一行记录” 等操作。但存储引擎不会去解析SQL,不同的存储引擎之间不进行通信,只是简单的响应上层服务的请求。

2.连接管理与安全性

每个客户端连接都会在服务中占有一个线程,这个连接的查询只在这个线程中执行,该线程只能轮流在某个CPU核心或者CPU中运行。服务器会缓存线程,因此不需要为每一个新建连接创建或销毁线程。

注:

1.Innodb是一个例外,它会解析外键定义,因为MySQL服务器本身没有实现该功能。

2.MySQL5.5以上的版本提供了一个API,支持线程池(Thread-Polling)插件,可以使用池中少量的线程来服务大量的连接。

当客户端连接到MySQL服务器时,服务会对其进行验证,认证基于用户名、原始主机信息,和密码。如果使用了SSL的方式连接,还可以使用X.509证书认证。连接成功后,服务器会继续验证其是否具有某些 特定的查询权限(例如对某个库的某张表执行select语句)。

3.优化与执行

MySQL会解析查询,并创建内部数据结构(解析树),然后对其进行各种优化,包括写查询、决定表的读取顺序,以及选择合适的索引等。用户可以通过特殊的关键字提示(hint)优化器,影响它的决策过程。也可以请求优化器解释(explain)优化过程的各个因素,使用用户可以知道服务器是如何进行优化决策的,并提供一个参考基准,便于用户重构查询和schema、修改相关配置,使应用尽可能的提高运行效率。

优化器并不关心表使用的是什么存储引擎,但存储引擎对于优化查询是有影响的。优化器会请求存储引擎提供容量或某个具体操作的开销信息,以及表数据的统计信息等。例如某些存储引擎的某种索引,可能对一些特定的查询会有优化。

对于select语句,在在解析查询之前,服务器会先检查查询缓存(Query Cache),如果能够在其中找到对应的查询,服务器就不必在执行查询解析,优化和执行的整个过程,进而直接返回查询缓存中的结果集。

4.并发控制

无论何时,只要有多个查询需要在同一时间修改数据都会产生并发控制的问题。并发控制是一个内容庞大的话题,有大量的理论文献对其进行过详细的论述。这里只简要的介绍MySQL如何控制并发读写。

以Unix系统的email box为例,典型的mbox文件格式是非常简单的。一个mbox邮箱中的所有邮件都串行在一起,彼此收尾相连。这种格式对于读取和分析邮件信息非常的友好,同事投递邮件也很容易,只要在文件末尾附加新的邮件内容给即可。

但如果两个进程在同一时间对一个邮箱投递邮件,会发生什么情况?显然,邮箱的数据会被破坏,凉风邮件的内容会交叉的附加在邮箱文件的末尾。设计良好的邮箱投递系统会通过锁(lock)来防止数据损坏。如果客户视图投递邮件,而邮箱已经被其他客户锁住,那就必须等待,直到锁释放才能进行投递。这种锁的方案在实际应用环境中虽然工作良好,但并支持并发处理、因为任意时刻,只有一个进程可以修改邮箱的数据,这在大容量的邮箱系统中时个问题。

4.1 读写锁

从邮箱中读取数据并没有这样麻烦,及时同时有多个用户并发读取也不会有问题,因为读取不会修改数据,所以不会出错。但如果某个客户在读取邮箱的同时,另外一个用户试图修改该邮件,读的客户可能会报错退出,也可能读取到数据不一致的数据,故读取邮箱也需要特别注意。

如果把上述的邮箱当成数据库中的一张表,把邮件当成表中的一行记录,就很容易看出,同样的问题依然存在。解决这类经典问题的方式就是并发控制,其实非常简单。在处理并发读或者写时,可以通过实现一个由两种类型的锁组成的系统来解决问题。这两种类型的锁通常被称为共享锁(shared lock)和排他锁(exclusive lock),也叫读锁(read lock) 和写锁(write lock)。

读锁是共享的,或者说是相互不阻塞的。多个客户同一时刻可以同时读取同一个资源,互不干扰。写锁则是排他的,也就是说一个写锁会阻塞其他的写锁和读锁,这是出于安全策略考虑,只有这样,才能确保在给定的时间里,只有一个用户执行写入,并防止其他用户读取正在写入的同一资源。

在实际的数据库系统中,每时每刻都在发生锁定,当某个用户在修改某一部分数据时,MySQL会通过锁定防止其他用户读取同一数据。大多时间,MySQL锁内部管理是透明的。

4.2锁粒度

一种提高共享资源并发性的方式就是让锁定对象更有选择性。尽可能的只锁定要修改的部分数据,而不是所有的资源。更理想的方式是,只对会修改的数据片进行精确的锁定。加锁也需要消耗资源,锁的各种操作,获得,检查,解除,释放锁等都会增加系统的开销。如果系统花费大量的时间来管理锁,而不是存储取数据,那么系统性能可能会因此受到影响。所以在不发生冲突的情况下,锁定的数量越少,系统的并发则越高。

所谓的锁策略,就是在锁的开销和数据的安全性之间寻求平衡,当然也会影响到性能。大多数商业数据库系统没有提供更多的选择,一般都是在表上施加行集锁(row-level lock),并以各种复杂的方式来实现,以便在锁比较多的情况下尽可能地提供更好的性能。而MySQL则提供了多种选择。每种MySQL存储引擎都可以实现自己的锁策略和锁粒度。在存储引擎的设计中,锁管理是个非常重要的决定。将锁粒度固定在某个级别,可以为某些特定的应用场景提供更好的性能,但同时却会失去对另外一些应用场景的良好支持。好在MySQL支持多个存储引擎的架构,所以不需要单一的通用解决方案。

表锁(table lock)

表锁是MySQL中最基本,且开销最小的策略。表锁类似于邮箱加锁机制,它会锁整张表。一个用户对表进行操作前需要先获得写锁,这回足鳃其他用户对该表的所有读写操作,只有没写锁时,读取时其他用户才可以获得读锁,读锁之间不互相阻塞。

在特定场景中,表可可能有良好的性能,例如 READ LOCAL 表锁支持某些类型的并发写操作。另外,写锁也可以比读锁有更高的优先级,因此写锁请求可能会被插入到读锁队列的前面)(写锁可以茶语到锁队列中读锁的前面,反之读锁则不能插入到写锁的前面)。

尽管存储引擎可以管理自己的锁,MySQL本身还是会使用各种有效的表锁来实现不同的目的。例如服务会为诸如ALTER TABLE 之类的语句使用表锁,而忽略存储引擎的锁机制。

行级锁(row lock)

行级锁可以最大程度地支持并发处理(同时带来了最大的锁开销)。在InnoDB和XtraDB,以及其他一些存储引擎中实现了行级锁。行级锁只在存储引擎层实现,而MySQL服务器层没有实现。服务器层完全不了解存储引擎中的锁实现

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值