MySQL 面试题合集(性能优化篇)

本文介绍了使用GPT面试助手软件“会议面试精灵”来提升面试表现,重点讲解了MySQL性能指标(如TPS、QPS、IOPS)、慢查询处理、查询优化、索引优化、表结构设计、读写分离、Sharding-JDBC功能以及MySQL多实例配置和主备库延迟保障的方法。
摘要由CSDN通过智能技术生成

🎈每日定期分享 | 面试求职经验 | 个人成长

开篇寄语
面试不必死记硬背,带着GPT去面试简直降维打击!

 

为您推荐一款颠覆性的GPT面试助手软件:“会议面试精灵”。这款工具能够实时分析语音内容、智能识别面试问题并生成精准答案,让您轻松应对八股文题目,从容处理各类复杂面试问题。
毕竟八股文在工作中很少使用,仅作为面试的筛选工具,不值得投入过多的精力。

 

如何获取“会议面试精灵”?
- 直接访问下载链接:https://www.interviewpass.fun
- 在搜索引擎中输入关键词:“会议面试精灵”(记得加上双引号)进行搜索。


目录

1、MySQL 性能指标都有哪些?如何得到这些指标?

① TPS(Transaction Per Second) 

② QPS(Query Per Second) 

③ IOPS(Input/Output Operations per Second) 

2、什么是慢查询?

3、如何开启慢查询日志?

4、如何定位慢查询?

5、MySQL 的优化手段都有哪些?

① 查询优化

② 优化索引的使用

③ 表结构设计优化

④ 表拆分

⑤ 读写分离

6、MySQL 常见读写分离方案有哪些?

7、介绍一下 Sharding-JDBC 的功能和执行流程?

8、什么是 MySQL 多实例?如何配置 MySQL 多实例?

9、怎样保证确保备库无延迟?​​​​​​​


1、MySQL 性能指标都有哪些?如何得到这些指标?

MySQL 的性能指标如下:

① TPS(Transaction Per Second) 

每秒事务数,即数据库每秒执行的事务数。

MySQL 本身没有直接提供 TPS 参数值,如果我们想要获得 TPS 的值,只有我们自己计算了,可以根据 MySQL 数据库提供的状态变量,来计算 TPS。

需要使用的参数:

  • Com_commit :表示提交次数,通过命令 show global status like 'Com_commit'; 获取;

  • Com_rollback:表示回滚次数,通过命令 show global status like 'Com_rollback'; 获取。

我们定义第一次获取的 Comcommit 的值与 Comrollback 值的和为 c_r1,时间为 t1;

第二次获取的 Comcommit 的值与 Comrollback 值的和为 cr2,时间为 t2,t1 与 t2 单位为秒。 那么 TPS = ( cr2 - c_r1 ) / ( t2 - t1 ) 算出来的就是该 MySQL 实例在 t1 与 t2 生命周期之间的平均 TPS。

② QPS(Query Per Second) 

每秒请求次数,也就是数据库每秒执行的 SQL 数量,包含 INSERT、SELECT、UPDATE、DELETE 等。 QPS = Queries / Seconds Queries 是系统状态值—总查询次数,可以通过 show status like 'queries'; 查询得出,如下所示:

format,png

Seconds 是监控的时间区间,单位为秒。 比如,采样 10 秒内的查询次数,那么先查询一次 Queries 值(Q1),等待 10 秒,再查询一次 Queries 值(Q2),那么 QPS 就可以通过,如下公式获得:

QPS = (Q2 - Q1) / 10

③ IOPS(Input/Output Operations per Second) 

每秒处理的 I/O 请求次数。

IOPS 是判断磁盘 I/O 能力的指标之一,一般来讲 IOPS 指标越高,那么单位时间内能够响应的请求自然也就越多。理论上讲,只要系统实际的请求数低于 IOPS 的能力,就相当于每一个请求都能得到即时响应,那么 I/O 就不会是瓶颈了。

注意:IOPS 与磁盘吞吐量不一样,吞吐量是指单位时间内可以成功传输的数据数量。

可以使用 iostat 命令,查看磁盘的 IOPS,命令如下:

yum install sysstat iostat -dx 1 10

IOPS = r/s + w/s 其中:

  • r/s:代表每秒读了多少次;

  • w/s:代表每秒写了多少次。

执行效果如下图所示:

format,png

2、什么是慢查询?

慢查询是 MySQL 中提供的一种慢查询日志,它用来记录在 MySQL 中响应时间超过阀值的语句,具体指运行时间超过 longquerytime 值的 SQL,则会被记录到慢查询日志中。

longquerytime 的默认值为 10,意思是运行 10S 以上的语句。默认情况下,MySQL 数据库并不启动慢查询日志,需要我们手动来设置这个参数,如果不是调优需要的话,一般不建议启动该参数,因为开启慢查询日志会给 MySQL 服务器带来一定的性能影响。慢查询日志支持将日志记录写入文件,也支持将日志记录写入数据库表。

使用 mysql> show variables like '%slow_query_log%'; 来查询慢查询日志是否开启,执行效果如下图所示:

format,png

slowquerylog 的值为 OFF 时,表示未开启慢查询日志。

3、如何开启慢查询日志?

开启慢查询日志,可以使用如下 MySQL 命令:

mysql> set global slowquerylog=1

不过这种设置方式,只对当前数据库生效,如果 MySQL 重启也会失效,如果要永久生效,就必须修改 MySQL 的配置文件 my.cnf,配置如下:

slowquerylog =1 slowquerylogfile=/tmp/mysqlslow.log

4、如何定位慢查询?

使用 MySQL 中的 explain 分析执行语句,比如:

explain select * from t where id=5;

如下图所示:

format,png

其中:

  • id — 选择标识符。id越大优先级越高,越先被执行。

  • select_type — 表示查询的类型。

  • table — 输出结果集的表

  • partitions — 匹配的分区

  • type — 表示表的连接类型

  • possible_keys — 表示查询时,可能使用的索引

  • key — 表示实际使用的索引

  • key_len — 索引字段的长度

  • ref— 列与索引的比较

  • rows — 大概估算的行数

  • filtered — 按表条件过滤的行百分比

  • Extra — 执行情况的描述和说明

其中最重要的就是 type 字段,type 值类型如下:

  • all — 扫描全表数据

  • index — 遍历索引

  • range — 索引范围查找

  • index_subquery — 在子查询中使用 ref

  • uniquesubquery — 在子查询中使用 eqref

  • refornull — 对 null 进行索引的优化的 ref

  • fulltext — 使用全文索引

  • ref — 使用非唯一索引查找数据

  • eq_ref — 在 join 查询中使用主键或唯一索引关联

  • const — 将一个主键放置到 where 后面作为条件查询, MySQL 优化器就能把这次查询优化转化为一个常量,如何转化以及何时转化,这个取决于优化器,这个比 eq_ref 效率高一点

5、MySQL 的优化手段都有哪些?

MySQL 的常见的优化手段有以下五种:

① 查询优化

  • 避免 SELECT *,只查询需要的字段。

  • 小表驱动大表,即小的数据集驱动大的数据集,比如,当 B 表的数据集小于 A 表时,用 in 优化 exist,两表执行顺序是先查 B 表,再查 A 表,查询语句:select * from A where id in (select id from B) 。

  • 一些情况下,可以使用连接代替子查询,因为使用 join 时,MySQL 不会在内存中创建临时表。

② 优化索引的使用

  • 尽量使用主键查询,而非其他索引,因为主键查询不会触发回表查询。

  • 不做列运算,把计算都放入各个业务系统实现

  • 查询语句尽可能简单,大语句拆小语句,减少锁时间

  • 不使用 select * 查询

  • or 查询改写成 in 查询

  • 不用函数和触发器

  • 避免 %xx 查询

  • 少用 join 查询

  • 使用同类型比较,比如 '123' 和 '123'、123 和 123

  • 尽量避免在 where 子句中使用 != 或者 <> 操作符,查询引用会放弃索引而进行全表扫描

  • 列表数据使用分页查询,每页数据量不要太大

  • 用 exists 替代 in 查询

  • 避免在索引列上使用 is null 和 is not null

  • 尽量使用主键查询

  • 避免在 where 子句中对字段进行表达式操作

  • 尽量使用数字型字段,若只含数值信息的字段尽量不要设计为字符型

③ 表结构设计优化

  • 使用可以存下数据最小的数据类型。

  • 使用简单的数据类型,int 要比 varchar 类型在 MySQL 处理简单。

  • 尽量使用 tinyint、smallint、mediumint 作为整数类型而非 int。

  • 尽可能使用 not null 定义字段,因为 null 占用 4 字节空间。

  • 尽量少用 text 类型,非用不可时最好考虑分表。

  • 尽量使用 timestamp,而非 datetime。

  • 单表不要有太多字段,建议在 20 个字段以内。

④ 表拆分

当数据库中的数据非常大时,查询优化方案也不能解决查询速度慢的问题时,我们可以考虑拆分表,让每张表的数据量变小,从而提高查询效率。 

a)垂直拆分:是指数据表列的拆分,把一张列比较多的表拆分为多张表,比如,用户表中一些字段经常被访问,将这些字段放在一张表中,另外一些不常用的字段放在另一张表中,插入数据时,使用事务确保两张表的数据一致性。 垂直拆分的原则:

  • 把不常用的字段单独放在一张表;

  • 把 text,blob 等大字段拆分出来放在附表中;

  • 经常组合查询的列放在一张表中。

b)水平拆分:指数据表行的拆分,表的行数超过200万行时,就会变慢,这时可以把一张的表的数据拆成多张表来存放。

通常情况下,我们使用取模的方式来进行表的拆分,比如,一张有 400W 的用户表 users,为提高其查询效率我们把其分成 4 张表 users1,users2,users3,users4,然后通过用户 ID 取模的方法,同时查询、更新、删除也是通过取模的方法来操作。

⑤ 读写分离

一般情况下对数据库而言都是“读多写少”,换言之,数据库的压力多数是因为大量的读取数据的操作造成的,我们可以采用数据库集群的方案,使用一个库作为主库,负责写入数据;其他库为从库,负责读取数据。这样可以缓解对数据库的访问压力。

6、MySQL 常见读写分离方案有哪些?

MySQL 常见的读写分离方案,如下列表:

1)应用层解决方案 可以通过应用层对数据源做路由来实现读写分离,比如,使用 SpringMVC + MyBatis,可以将 SQL 路由交给 Spring,通过 AOP 或者 Annotation 由代码显示的控制数据源。 优点:路由策略的扩展性和可控性较强。 缺点:需要在 Spring 中添加耦合控制代码。

2)中间件解决方案 通过 MySQL 的中间件做主从集群,比如:Mysql Proxy、Amoeba、Atlas 等中间件都能符合需求。 优点:与应用层解耦。 缺点:增加一个服务维护的风险点,性能及稳定性待测试,需要支持代码强制主从和事务。

7、介绍一下 Sharding-JDBC 的功能和执行流程?

Sharding-JDBC 在客户端对数据库进行水平分区的常用解决方案,也就是保持表结构不变,根据策略存储数据分片,这样每一片数据被分散到不同的表或者库中,Sharding-JDBC 提供以下功能:

  • 分库分表

  • 读写分离

  • 分布式主键生成

Sharding-JDBC 的执行流程:当业务代码调用数据库执行的时候,先触发 Sharding-JDBC 的分配规则对 SQL 语句进行解析、改写之后,才会对改写的 SQL 进行执行和结果归并,然后返回给调用层。

8、什么是 MySQL 多实例?如何配置 MySQL 多实例?

MySQL 多实例就是在同一台服务器上启用多个 MySQL 服务,它们监听不同的端口,运行多个服务进程,它们相互独立,互不影响的对外提供服务,便于节约服务器资源与后期架构扩展。 多实例的配置方法有两种:

- 一个实例一个配置文件,不同端口;

- 同一配置文件(my.cnf)下配置不同实例,基于 MySQL 的 d_multi 工具。

9、怎样保证确保备库无延迟?

通常保证主备无延迟有以下三种方法:

1、每次从库执行查询请求前,先判断 secondsbehindmaster 是否已经等于 0。如果还不等于 0 ,那就必须等到这个参数变为 0 才能执行查询请求,secondsbehindmaster 参数是用来衡量主备延迟时间的长短;

2、对比位点确保主备无延迟。MasterLogFile 和 ReadMasterLogPos,表示的是读到的主库的最新位点,RelayMasterLogFile 和 ExecMasterLog_Pos,表示的是备库执行的最新位点;

3、对比 GTID 集合确保主备无延迟。AutoPosition=1 ,表示这对主备关系使用了 GTID 协议;RetrievedGtidSet,是备库收到的所有日志的 GTID 集合;ExecutedGtid_Set,是备库所有已经执行完成的 GTID 集合。

  • 25
    点赞
  • 24
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
数据库面试题大库随着随着互联技术的普及和应用,人类社会已经进入大数据时代,各行各业也都需要大量数据的支持,而根据大数据五V特性之一数据价值密度低,从大量数据爬去出有用的信息就是大难点。基于Python的爬虫技术可以自动完成网络数据的收集、解析、格式化存储,而rabbitmq可以实现分布式爬虫技术,大大提升工作效率。下面主要以时间顺序列出研究rabbitmq爬虫相关技术的发展以及应用。随着互联技术的普及和应用,人类社会已经进入大数据时代,各行各业也都需要大量数据的支持,而根据大数据五V特性之一数据价值密度低,从大量数据爬去出有用的信息就是大难点。基于Python的爬虫技术可以自动完成网络数据的收集、解析、格式化存储,而rabbitmq可以实现分布式爬虫技术,大大提升工作效率。下面主要以时间顺序列出研究rabbitmq爬虫相关技术的发展以及应用。随着互联技术的普及和应用,人类社会已经进入大数据时代,各行各业也都需要大量数据的支持,而根据大数据五V特性之一数据价值密度低,从大量数据爬去出有用的信息就是大难点。基于Python的爬虫技术可以自动完成网络数据的收集、解析、格式化存储,而rabbitmq可以实现分布式爬虫技术,大大提升工作效率。下面主要以时间顺序列出研究rabbitmq爬虫相关技术的发展以及应用。随着互联技术的普及和应用,人类社会已经进入大数据时代,各行各业也都需要大量数据的支持,而根据大数据五V特性之一数据价值密度低,从大量数据爬去出有用的信息就是大难点。基于Python的爬虫技术可以自动完成网络数据的收集、解析、格式化存储,而rabbitmq可以实现分布式爬虫技术,大大提升工作效率。下面主要以时间顺序列出研究rabbitmq爬虫相关技术的发展以及应用。随着互联技术的普及和应用,人类社会已经进入大数据时代,各行各业也都需要大量数据的支持,而根据大数据五V特性之一数据价值密度低,从大量数据爬去出有用的信息就是大难点。基于Python的爬虫技术可以自动完成网络数据的收集、解析、格式化存储,而rabbitmq可以实现分布式爬虫技术,大大提升工作效率。下面主要以时间顺序列出研究rabbitmq爬虫相关技术的发展以及应用。随着互联技术的普及和应用,人类社会已经进入大数据时代,各行各业也都需要大量数据的支持,而根据大数据五V特性之一数据价值密度低,从大量数据爬去出有用的信息就是大难点。基于Python的爬虫技术可以自动完成网络数据的收集、解析、格式化存储,而rabbitmq可以实现分布式爬虫技术,大大提升工作效率。下面主要以时间顺序列出研究rabbitmq爬虫相关技术的发展以及应用。随着互联技术的普及和应用,人类社会已经进入大数据时代,各行各业也都需要大量数据的支持,而根据大数据五V特性之一数据价值密度低,从大量数据爬去出有用的信息就是大难点。基于Python的爬虫技术可以自动完成网络数据的收集、解析、格式化存储,而rabbitmq可以实现分布式爬虫技术,大大提升工作效率。下面主要以时间顺序列出研究rabbitmq爬虫相关技术的发展以及应用。随着互联技术的普及和应用,人类社会已经进入大数据时代,各行各业也都需要大量数据的支持,而根据大数据五V特性之一数据价值密度低,从大量数据爬去出有用的信息就是大难点。基于Python的爬虫技术可以自动完成网络数据的收集、解析、格式化存储,而rabbitmq可以实现分布式爬虫技术,大大提升工作效率。下面主要以时间顺序列出研究rabbitmq爬虫相关技术的发展以及应用。随着互联技术的普及和应用,人类社会已经进入大数据时代,各行各业也都需要大量数据的支持,而根据大数据五V特性之一数据价值密度低,从大量数据爬去出有用的信息就是大难点。基于Python的爬虫技术可以自动完成网络数据的收集、解析、格式化存储,而rabbitmq可以实现分布式爬虫技术,大大提升工作效率。下面主要以时间顺序列出研究rabbitmq爬虫相关技术的发展以及应用。随着互联技术的普及和应用,人类社会已经进入大数据时代,各行各业也都需要大量数据的支持,而根据大数据五V特性之一数据价值密度低,从大量数据爬去出有用的信息就是大难点。基于Python的爬虫技术可以自动完成网络数据的收集、解析、格式化存储,而rabbitmq可以实现分布式爬虫技术,大大提升工作效率。下面主要以时间顺序列出研究rabbitmq爬虫相关技术的发展以及应用。随着互联技术的普及和应用,人类社会已经进入大数据时代,各行各业也都需要大量数据的支持,而根据大数据五V特性之一数据价值密度低,从大量数据爬去出有用的信息就是大难点。基于Python的爬虫技术可以自动完成网络数据的收集、解析、格式化存储,而rabbitmq可以实现分布式爬虫技术,大大提升工作效率。下面主要以时间顺序列出研

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值