MySQL 高频面试题

最新推荐文章于 2024-07-25 11:05:57 发布

Roc Lau

最新推荐文章于 2024-07-25 11:05:57 发布

阅读量137

点赞数

分类专栏： Java面试文章标签： mysql

本文链接：https://blog.csdn.net/weixin_39977988/article/details/125549042

版权

Java面试专栏收录该内容

10 篇文章 0 订阅

订阅专栏

本文探讨了数据库索引的重要性，重点介绍了B+树作为索引结构的原因，包括其降低I/O操作、支持范围查询的优势。同时，阐述了最左匹配原则在联合索引中的应用，以及如何通过覆盖索引优化查询性能。此外，讨论了建表时的索引设计策略，如选择唯一索引、限制JOIN操作和考虑字段类型匹配。最后，提及了一级缓存和二级缓存在MyBatis中的作用，以及MySQL主从同步和Binlog日志。

摘要由CSDN通过智能技术生成

使用 B + 树。

这个问题，你可以在脑子里面先思考一下，如果让你来设计数据库的索引，你会怎么设计？

我们还是用 Why？What？How？三步法来看这个问题。

为什么会需要索引？索引是什么？索引怎么用的？

再思考为什么需要 B + 树？B + 树是什么？B + 树怎么用？

答：大部分程序主要的功能都是对数据的处理，写入、查询、转化、输出。最形象的比喻就是树和内容和目录的关系，目录就是索引，我们根据目录能快速拿到想要内容的页码。

为什么是 B + 树，有这个几个理由：

如果是用 AVL 平衡二叉树，树高度太高，索引查询需要访问磁盘，每次访问以节点为单位进行磁盘 I/O ，需要尽量减少数据读取的 I/O 操作，所以树高度一定不能太高，存储千万级别的数据，实践中 B+ 树的高度也就 4 或者 5。
B + 树经常用来比较的是 B 树，B + 树相比 B 树有个很大的特点是 B + 树所有关键字都出现在叶子结点的链表中（稠密索引），且链表中的关键字恰好是有序的，对于范围查找，比如 15～50，B 树需要中序遍历二叉树，但是 B + 树直接在叶子节点顺序访问就可以了。

什么是最左匹配原则？

首先说明一点：

最左前缀匹配原则：在 MySQL 建立联合索引时会遵守最左前缀匹配原则，即最左优先，在检索数据时从联合索引的最左边开始匹配。

打个比方，我们有张 student 表，我们根据学院编号 + 班级建立了一个联合索引 index_magor_class (magor,class), 这个索引由二个字段组成。

索引的底层是一颗 B + 树，那么联合索引的底层也就是一颗 B + 树，只不过联合索引的 B + 树节点中存储的是逗号分隔的多个值。

举例：创建一个 index_magor_class (magor,class) 的联合索引，那么它的索引树就是下图的样子。

它是先根据 magor 排序，再根据 class 排序，如果索引后面还有字段，继续以此类推。

我们查询的 where 条件如果只传入了班级，是走不到联合索引的，但是如果只传了学院编号，是可能会走到联合索引的。（为什么说可能，MYSQL 的执行计划和查询的实际执行过程并不完全吻合，比如你数据库数据量很少，可能直接全量遍历速度更快，就不走索引了）

在建表的时候如何设计索引的？有没有做过索引优化？

利用覆盖索引来进行查询操作，来避免回表操作。

说明：如果一本书需要知道第 11 章是什么标题，会翻开第 11 章对应的那一页吗？目录浏览一下就好，这个目录就是起到覆盖索引的作用。

什么意思，比如你主键索引是学号，你写 select 语句的时候，直接 select 学号 from table 就可以了，不用 select 其他字段，一般除非非常有必要，尽量按需 select 字段，少用或不用 **select ***，不然还需要回表。

这里我解释一下回表，比如我们表主键索引是学号，另外我们还根据手机号也建了索引，如果我们 where 条件是手机号，分二种情况：

正例：IDB 能够建立索引的种类分为【主键索引、唯一索引、普通索引】，而覆盖索引是一种查询的一种效果，用 explain 的结果，extra 列会出现：using index.

如果我们 select 获取的字段是学号，直接在手机号的索引表就能获取到数据，不需要回表；
如果我们 select 的时候还有其他字段，我们查询的时候流程是这样的，先根据手机号查到学号，再根据学号去主键索引表查询数据，这个过程叫回表。

业务上具有唯一特性的字段，即使是组合字段，也建议建成唯一索引。说明：不要以为唯一索引影响了 insert 速度，这个速度损耗可以忽略，但提高查找速度是明显的；另外，即使在应用层做了非常完善的校验和控制，只要没有唯一索引，根据墨菲定律，必然有脏数据产生。
超过三个表禁止 join。需要 join 的字段，数据类型保持绝对一致；多表关联查询时，保证被关联的字段需要有索引。说明：即使双表 join 也要注意表索引、SQL 性能。
在 varchar 字段上建立索引时，必须指定索引长度，没必要对全字段建立索引，根据实际文本区分度决定索引长度。说明：索引的长度与区分度是一对矛盾体，一般对字符串类型数据，长度为 20 的索引，区分度会高达 90% 以上，可以使用 count (distinct left (列名，索引长度))/count (*) 的区分度来确定。
页面搜索严禁左模糊或者全模糊，如果需要请走搜索引擎来解决。说明：索引文件具有 B-Tree 的最左前缀匹配特性，如果左边的值未确定，那么无法使用此索引。
SQL 性能优化的目标：至少要达到 range 级别，要求是 ref 级别，如果可以是 const 最好。说明：

const 单表中最多只有一个匹配行（主键或者唯一索引），在优化阶段即可读取到数据。
ref 指的是使用普通的索引。（normal index）
range 对索引进行范围检索。反例：explain 表的结果，type=index，索引物理文件全扫描，速度非常慢，这个 index 级别比较 range 还低，与全表扫描是小巫见大巫。

建组合索引的时候，区分度最高的在最左边。正例：如果 where a=? and b=? ，a 列的几乎接近于唯一值，那么只需要单建 idx_a 索引即可。说明：存在非等号和等号混合判断条件时，在建索引时，请把等号条件的列前置。如：where c>? and d=? 那么即使 c 的区分度更高，也必须把 d 放在索引的最前列，即建立组合索引 idx_d_c。
防止因字段类型不同造成的隐式转换，导致索引失效。

MyBatis 用过吗？一二级缓存清楚吗？

一级缓存 Mybatis 的一级缓存是指 SQLSession，一级缓存的作用域是 SQlSession, Mabits 默认开启一级缓存。在同一个 SqlSession 中，执行相同的 SQL 查询时；第一次会去查询数据库，并写在缓存中，第二次会直接从缓存中取。当执行 SQL 时候两次查询中间发生了增删改的操作，则 SQLSession 的缓存会被清空。每次查询会先去缓存中找，如果找不到，再去数据库查询，然后把结果写到缓存中。Mybatis 的内部缓存使用一个 HashMap，key 为 hashcode+statementId+sql 语句。Value 为查询出来的结果集映射成的 java 对象。SqlSession 执行 insert、update、delete 等操作 commit 后会清空该 SQLSession 缓存。
二级缓存二级缓存是 mapper 级别的，Mybatis 默认是没有开启二级缓存的。第一次调用 mapper 下的 SQL 去查询用户的信息，查询到的信息会存放在该 mapper 对应的二级缓存区域。第二次调用 namespace 下的 mapper 映射文件中，相同的 sql 去查询用户信息，会去对应的二级缓存内取结果。