MySQL常见面试题

最新推荐文章于 2024-10-01 18:51:18 发布

Jm呀

最新推荐文章于 2024-10-01 18:51:18 发布

阅读量1.5k

点赞数 3

分类专栏： Java面试全集文章标签： java 面试

本文链接：https://blog.csdn.net/m0_66689823/article/details/130907484

版权

Java面试全集专栏收录该内容

13 篇文章 1 订阅 ¥9.90 ¥99.00

订阅专栏

本文详细介绍了MySQL面试中常见的问题，包括事务的四大特性、数据库范式、事务隔离级别、并发事务问题、MVCC、索引的优缺点与类型、B+树与哈希索引的区别、存储引擎的对比以及锁机制等。内容覆盖了数据库设计、性能优化和并发控制等多个方面，是准备MySQL面试的重要参考资料。

摘要由CSDN通过智能技术生成

参考：程序员大斌、javauide、小林coding

1.事务是什么？

由多个操作组成的一个逻辑单元，逻辑单元的多个操作要么同时成功，要么同时失败。

2.事务的四大特性

原子性：一个事务内的操作统一成功或失败

一致性：一个事务执行之前和执行之后都必须处于一致性状态（两人转账，合计100元）

隔离性：事务与事务之间相互不影响

持久性：事务一旦提交数据的改变不可逆

3.数据库三大范式

第一范式：每个列原子性，都不可再分。

第二范式：在第一范式的基础上，非主键列完全依赖于主键，而不能是依赖于主键的一部分。

第三范式：在第二范式的基础上，非主键列只依赖于主键，不能存在传递依赖。

4.事务的隔离级别

在高并发情况下，并发事务会产生脏读、不可重复读、幻读问题，这时需要用隔离级别来控制

读未提交：允许一个事务读取另一个事务已提交的数据，可能出现脏读、不可重复读，幻读。

读已提交：只允许事务读取另一个事务没有提交的数据可能出现不可重复读，幻读。

可重复读：确保同一字段多次读取结果一致，可能出现欢幻读。

可串行化：所有事务逐次执行，没有并发问题

InnoDB 默认隔离级别为可重复读级别，分为快照度和当前读，并且通过间隙锁解决了幻读问题。

5.并发事务存在的问题

脏读：在一个事务中，可以读到另一个事务还没有提交的数据

不可重复读：在一个事务中，前后两次的查询结果不一致。比如，在两次查询间隔期间，其他的事务修改了数据。

幻读：在一个事务中，读取操作的结论不能支撑之后业务的执行。比如，先查询一条id为2的数据不存在，然后进行新增id为2的数据，却发现新增失败，这个期间可能被其他的事务新增了id为2的数据，产生了幻读现象。

6.事务靠什么保证

原子性：由undolog日志保证（见36题）

一致性：由其他三大特性共同保证，是事务的目的

隔离性：由MVCC保证，给每个事务添加版本号

持久性：由redolog日志保证（见35题）

7.MVCC是什么

MVCC是多版本并发控制，为每次事务生成一个新版本数据，每个事务都由自己的版本，从而不加锁就解决读写冲突，这种读叫做快照读。只在读已提交和可重复读中生效。

实现原理由四个东西保证，他们是

undolog日志：记录了数据历史版本

readView:事务进行快照读时生成的内存快照，记录了当前系统中活跃的事务id

隐藏字段DB_TRC_ID：最近修改记录的事务ID

隐藏字段DB_Roll_PTR：回滚指针，配合undolog指向数据的上一个版本

8.生产环境数据库一般用的什么隔离级别？

生产环境大多使用RC。而不是RR。

在RR隔离级别下，存在间隙锁，导致出现死锁的几率比RC大的多
在RR隔离级别下，条件列未命中索引会锁表！而在RC隔离级别下，只锁行!

9.索引是什么？

索引是帮助Mysql高效获取数据的一种排好序的数据结构，底层使用B+树来实现。

10.索引的优缺点？

优点：基于b+树实现，加快数据查找的速度。

缺点：建立索引占用物理空间，增删改需要动态维护索引。

11.索引越多越好吗？

不是的，索引越多，维护索引结构的代价也就越大，会影响增删改的效率

12.什么字段需要建索引？

1.主键或者外键

2.where order_by group_by on 后面的字段

3.频繁访问的字段

4.表记录多的。

5.需要排序的字段。

13.什么字段不需要建索引？

1.空值或重复值多的字段

2.经常增删改的字段。增删改后，需要维护索引。

3.参与列计算。

4.区分度不高。如性别：男/女

4.表记录少的。

14.索引什么时候会失效？

（1）where条件中有or

（2）like查询用%开头

（3）索引列参与计算

（4）违背最左匹配原则

（5）索引字段发生类型转换

（6）MySQL觉得全表扫描比走索引更快

15.索引的分类(数据结构/存储方式/应用维度)

按数据结构分：B+树索引和哈希索引。

BTree 索引：MySQL 里默认和最常用的索引类型。只有叶子节点存储 value，非叶子节点只有指针和 key。存储引擎 MyISAM 和 InnoDB 实现 BTree 索引都是使用 B+Tree

哈希索引：类似键值对的形式，一次即可定位

按存储方式分：聚簇索引和非聚簇索引。

聚簇索引：索引值和数据一起存放的索引，InnoDB 中的主键索引就属于聚簇索引。

非聚簇索引：索引值和数据分开存放的索引，二级索引(辅助索引)就属于非聚簇索引。

按应用维度分：

主键索引：一张表只能有一个主键索引，不能有空值和重复值

唯一索引：不能有相同值，但允许为空

普通索引：仅加速查询。

组合索引：对多个字段建立一个联合索引，减少索引开销，遵循最左匹配原则

全文索引：只能在CHAR、VARCHAR和TEXT类型字段上使用全文索引。

16.B和B+树的区别，为什么使用B+树

B树：每个节点都存储了索引值+具体数据，若要进行范围查询，要进行多次回溯，开销大

B+树：非叶子节点只存储索引值，叶子节点才存储索引值+具体数据，从小到大用双向链表连接在一起，范围查询直接遍历叶子节点不需要回溯

因为mysql中经常用到范围查询，所以使用B+树更为合适。

17.B+树索引和哈希索引的区别？

哈希索引不支持排序，因为哈希表是无序的。
哈希索引不支持范围查找。
哈希索引不支持模糊查询及多列索引的最左前缀匹配。
因为哈希表中会存在哈希冲突，所以哈希索引的性能是不稳定的，而B+树索引的性能是相对稳定的，每次查询都是从根节点到叶子节点。

18.聚簇索引和非聚簇索引的区别

聚簇索引叶子节点存储的是行数据；而非聚簇索引叶子节点存储的是主键值。
聚簇索引查询效率更高；而非聚簇索引需要进行回表查询，效率低。
聚簇索引一般为主键索引，所以聚簇索引一个表只有一个；而非聚簇索引则没有数量上的限制。

19.聚集索引选取规则？

如果存在主键，主键索引就是聚集索引。
如果不存在主键，将使用第一个唯一（UNIQUE）索引作为聚集索引。
如果都不存在，则InnoDB会自动生成一个row_id作为隐藏的聚集索引。

20.什么是最左前缀匹配原则？

最左前缀匹配原则指的是查询从索引的最左列开始，并且不跳过索引中的列。如果跳跃某一列，那么这一列后面的索引都会失效。

21.回表查询是什么?回表原因？

key：主键字段、唯一索引字段、隐藏的row_id

回表查询：先到二级索引中查找数据，找到key（主键值），然后再到聚集索引中根据key（主键值），获取数据的方式.

回表的原因：select查询要的字段在二级索引的字段中不存在，需要去主键索引获取，因为主键索引含有整行记录值

22.什么是覆盖索引？

需要查询的字段正好是索引的字段，那么直接根据该索引，就可以查到数据了，而无需回表查询。

23.什么是前缀索引？

前缀索引是指对文本或者字符串的前几个字符建立索引，这样索引的长度更短，查询速度更快。

24.什么是索引下推?

当存在索引的字段做为判断条件时，把一部分原来需要在Server端完成的条件判断转交给存储引擎去处理。

优点：减少回表查询次数，提高查询效率

缺点：只适合于非主键索引且为组合索引

25.执行计划中有哪些重要字段？

id:select查询的优先级，id越大优先级越高

type:扫描类型，效率从底到高为：ALL > index > range > ref > eq_ref > const > system

key:实际使用到的索引

rows:估算大概多少行数据被查找了

extra:MySQL如何查询额外信息，常见的有：

Using filesort:排序时使用外部排序而不是索引排序

backward index scan:按照降序排序时反向扫描索引

Using index:表示使用覆盖索引

Using temporary:查询时要建立一个临时表存放数据

26.常见的存储引擎有哪些？

存储引擎是用来把数据存储在文件或内存的技术；
MySQL常用的索引有InnoDB、MyISAM、MEMORY；
InnoDB支持事务，外键，行级锁MySQL5.6版本以上才支持全文索引。
MyISAM不支持事务，外键，行级锁，支持表锁，支持全文索引。

27.MyIsAm和InnoDB的区别

InnoDB有三大特性，分别是事务、外键、行级锁，这些都是MyIsAm不支持的，

另外InnoDB是聚簇索引，MyIAm是非聚簇索引，

InnoDB不支持全文索引，MyIAm支持

InnoDB支持自增和MVCC模式的读写，MyIAm不支持

MyIsAM的访问速度一般InnoDB快，差异在于innodb的mvcc、行锁会比较消耗性能，还可能有回表的过程（先去辅助索引中查询key（主键值），再通过key（主键值）回表到聚簇索引树查找数据）

28.MySQL有哪些锁

按锁粒度分类：行级锁、表级锁和页级锁。

表级锁：对整张表加锁，粒度大并发小
行级锁：对行加锁，粒度小并发大

行级锁的类型主要有三类：
- 记录锁(Record Lock)，也就是仅仅把一条记录锁上；
- 间隙锁(Gap Lock)，锁定一个范围，但是不包含记录本身；
- 临键锁(Next-Key Lock)：Record Lock + Gap Lock 的组合，锁定一个范围，并且锁定记录本身。
间隙锁：间隙锁，锁住表的一个区间，间隙锁之间不会冲突只在可重复读下才生效，解决了幻读

按锁级别分类：共享锁、排他锁和意向锁。

共享锁：又称读锁，一个事务为表加了读锁，其它事务只能加读锁，不能加写锁
排他锁：又称写锁，一个事务加写锁之后，其他事务不能再加任何锁，避免脏读问题
意向锁：设计目的为了在一个事务中揭示下一行将要被请求锁的类型。 InnoDB 自动加的，不需要用户干预。
- 意向共享锁（IS）：表示事务准备给数据行加入共享锁，也就是说一个数据行加共享锁前必须先取得该表的IS锁；
- 意向排他锁（IX）：类似上面，表示事务准备给数据行加入排他锁，说明事务在一个数据行加排他锁前必须先取得该表的IX锁。

对于INSERT、UPDATE和DELETE，InnoDB 会自动给涉及的数据加排他锁；对于一般的SELECT语句，InnoDB 不会加任何锁，事务可以通过以下语句显式加共享锁或排他锁。

共享锁：SELECT … LOCK IN SHARE MODE;

排他锁：SELECT … FOR UPDATE;

29.快照读和当前读

快照读读取的是当前数据的可见版本，可能会是过期数据。如不加锁的select就是快照读

当前读读取的是数据的最新版本，并且当前读返回的记录都会上锁，保证其他事务不会并发修改这条记录。如update、insert、delete、select for undate（排他锁）、select lock in share mode（共享锁）都是当前读

30.什么情况下会产生死锁?

事务1已经获取数据A的写锁，想要去获取数据B的写锁，然后事务2获取了B的写锁，想要去获取A的写锁，相互等待形成死锁。

31.MySQL解决死锁的两个机制

等待，直到超时
发起死锁检测，主动回滚一条事务

死锁检测的原理：是构建一个以事务为顶点、锁为边的有向图，判断有向图是否存在环，存在即有死锁。

32.MySQL 中常见的日志有哪些？

bin log（二进制日志）和 redo log（重做日志）和 undo log（回滚日志）、慢查询日志

bin log中记录的是整个mysql数据库的操作内容，对所有的引擎都适用，可以用来进行数据库的恢复及控制。

redo log中记录的是要更新的数据，比如一条数据已提交成功，并不会立即同步到磁盘，而是记录到redo log中，等待合适的时机再刷盘，为了实现事务的持久性。

undo log中记录的是当前操作的相反操作，如一条insert语句在undo log中会对应一条delete语句，在任务回滚时会用到undo log,实现事务的原子性，同时会用在MVCC中，undolog会有一条记录的多个版本，用在快照读中。

33.慢查询日志有什么用？

记录在 MySQL 中执行时间超过指定时间的查询语句。

34.binlog 和redolog有什么区别？

bin log会记录所有日志记录，包括InnoDB、MyISAM等存储引擎的日志；redo log只记录innoDB自身的事务日志。

bin log只在事务提交前写入到磁盘，一个事务只写一次；而在事务进行过程，会有redo log不断写入磁盘。

bin log是逻辑日志，记录的是SQL语句的原始逻辑；redo log是物理日志，记录的是在某个数据页上做了什么修改。

35.redolog如何保证事务的持久性？

redo log中记录的是要更新的数据，如一条数据已提交成功，并不会立即同步到磁盘，而是记录到redo log中，等待合适的时机再刷盘，为了实现事务的持久性。

36.undolog如何保证事务的原子性？

undo log中记录的是当前操作的相反操作，如一条insert语句在undo log中会对应一条delete语句，在任务回滚时会用到undo log,实现事务的原子性

37.读写分离

读写分离主要是为了将对数据库的读写操作分散到不同的数据库节点上。这样的话，就能够小幅提升写性能，大幅提升读性能。
读写分离基于主从复制，MySQL 主从复制是依赖于 binlog 。

38.分库分表

为什么要分库分表？

当单表的数据量达到千万级之后，优化索引、添加从库等可能对数据库性能提升效果不明显。

划分方式？

垂直划分：

垂直划分数据库是根据业务进行划分，例如购物场景，可以将库中涉及商品、订单、用户的表分别划分出成一个库，通过降低单库的大小来提高性能。同样的，分表的情况就是将一个大表根据业务功能拆分成一个个子表，例如商品基本信息和商品描述，商品基本信息一般会展示在商品列表，商品描述在商品详情页，可以将商品基本信息和商品描述拆分成两张表。

优点：行记录变小，数据页可以存放更多记录，在查询时减少I/O次数。

缺点：