5个MySQL高频面试题详解

最新推荐文章于 2024-09-24 11:45:59 发布

一代枭雄_宗某

最新推荐文章于 2024-09-24 11:45:59 发布

阅读量115

点赞数

分类专栏：面试题文章标签：数据库中间件

本文链接：https://blog.csdn.net/m0_60566325/article/details/125067678

版权

面试题专栏收录该内容

1 篇文章 0 订阅

订阅专栏

本文介绍了MySQL的主备、主从和主主架构的区别，详细阐述了读写分离的原因和实现方式，包括中间件和代码封装的优缺点。还解析了MySQL的主从同步机制，涉及binlog、异步复制和半同步复制，并提出了处理主从同步延迟的策略。最后，讨论了面试中可能遇到的数据库备份和高可用性问题。

摘要由CSDN通过智能技术生成

MySQL 面试题开始要更新啦！

请接招。

你们公司数据库有备份的吧？
我：有的，因为单点故障的情况不可避免，所以我们公司有主从。

面试官：那你知道主备、主从、主主有什么区别？

主备就是：主机和备机。
备机是不干活的，也就是不对外提供服务，只是默默地在同步主机的数据，然后等着某一天主机挂了之后，它取而代之！

至于切换的话主要有两种方式：

人工切换，得知主机挂了之后手动把备机切成主机，缺点就是慢。
利用 keepalived 或者自己写个脚本来作监控，然后自动切换。
主从就是主机和从机。
从机和备机的区别在于，它是对外提供服务的，一般而言主从就是读写分离，写请求指派到主机，读请求指派到从机。

主主就是两个都是主机

一般情况下都不会有主主的架构。

当同时有两个写请求达到分别打到两个主库同一张表的时候，则会同时创建一条记录，这条记录的 ID 是一样的，这样数据同步之后其中有一条就会被覆盖了，这会出问题的。

为什么要读写分离啊？
读写分离就是读操作和写操作从以前的一台服务器上剥离开来，将主库压力分担一些到从库。

本质上是因为访问量太大，主库的压力过大，单机数据库无法支撑并发读写。

然后一般而言读的次数远高于写，因此将读操作分发到从库上，这就是常见的读写分离。

读写分离还有个操作就是主库不建查询的索引，从库建查询的索引。

因为索引是需要维护的，比如你插入一条数据，不仅要在聚簇索引上面插入，对应的二级索引也得插入，修改也是一样的。

所以将读操作分到从库了之后，可以在主库把查询要用的索引删了，减少写操作对主库的影响。

你们读写分离是用中间件的还是代码封装的？
代码封装
讲白了就是代码层面抽出一个中间层，由中间层来实现读写分离和数据库连接。

就是搞了个代理类，对外暴露正常的读写接口，里面封装了逻辑，将读操作指向从库的数据源，写操作指向主库的数据源。

优点：简单，并且可以根据业务定制化变化，随心所欲。
缺点：如果数据库宕机了，发生主从切换了之后，就得修改配置重启。如果系统是多语言的话，需要为每个语言都实现一个中间层代码，重复开发。
中间件
一般而言是独立部署的系统，客户端与这个中间件的交互是通过 SQL 协议的。

所以在客户端看来连接的就是一个数据库，通过 SQL 协议交互也可以屏蔽多语言的差异。

缺点就是整体架构多了一个系统需要维护，并且可能成为性能瓶颈，毕竟交互都需要经过它中转。

常见的开源数据库中间件有：官方的 MySQL-Proxy、360 的 Atlas、Mycat 等。

MySQL 主从同步机制你知道吗？
主从同步主要依赖的就是 binlog，MySQL 默认是异步复制，具体流程如下：

主库：

接受到提交事务请求
更新数据
将数据写到 binlog 中
给客户端响应
推送 binlog 到从库中
从库：

由 I/O 线程将同步过来的 binlog 写入到 relay log 中。
由 SQL 线程从 relay log 重放事件，更新数据
给主库返回响应。

用一句话概括一下：主库提交事务会写 binlog，会由一个 dump 线程推送给从库，从库接受之后会有一个 I/O 线程将其写到 relay log 中，慢慢消化，由 SQL 线程来重放更新数据。

异步复制有数据丢失风险，例如数据还未同步到从库，主库就给客户端响应，然后主库挂了，此时从库晋升为主库的话数据是缺失的。

所以有同步复制，主库需要将 binlog 复制到所有从库，等所有从库响应了之后才会给客户端响应，这样的话性能很差，一般不会选择同步复制。

MySQL 5.7 之后搞了个半同步复制，有个参数可以选择 “成功同步几个从库就返回响应。”

比如一共有 3 个从库，我参数配置 1，那么只要有一个从库响应说复制成功了，主库就直接返回响应给客户端，不会等待其他两个从库。

这样的话性能就比较好，并且数据可靠性也增强了，只有当那个从库和主库同时都挂了，才会缺失数据。

主从同步延迟怎么处理啊？
从上图的流程就可以得知，延迟是必然存在的。

延迟过大的话就有可能出现一个用户刚注册，然后登陆报该用户不存在的....

因为数据是写到主库中的，查询走从库有可能还未来同步完毕，导致查不到这个用户。

这就非常不友好了。

常见解决方式有以下几种：

二次查询。如果从库查不到数据，则再去主库查一遍，由 API 封装即可，算是一个兜底策略，比较简单。不过等于读的压力又转移到主库身上了，如果有不法分子估计搞一下必定查不到的查询，这就难受了。
强制将写之后立马读的操作转移到主库上。这种属于代码写死了，比如一些写入之后立马查询的操作，就绑定在一起，写死都走主库。不推荐，太僵硬了。
关键业务读写都走主库，非关键还是读写分离。比如上面我举例的用户注册这种，可以读写主库，这样就不会有登陆报该用户不存在的问题，这种访问量频次应该也不会很多，所以看业务适当调整此类接口。