面试总结-mysql

雨天落叶丶

于 2021-07-12 14:06:51 发布

阅读量359

点赞数

分类专栏：面试题总结

本文链接：https://blog.csdn.net/weixin_42946608/article/details/118673840

版权

面试题总结专栏收录该内容

13 篇文章 0 订阅

订阅专栏

本文深入探讨了MySQL的一级和二级索引，强调了索引在数据存储和查询效率上的作用。同时，讲解了SQL优化技巧，包括表结构优化、查询优化和索引优化，以及如何通过`EXPLAIN`分析执行计划。此外，对比了聚集索引与非聚集索引、B+树与其他数据结构的区别，并阐述了Hash索引和B+树索引的适用场景。最后，讨论了数据库事务、锁机制、MVCC以及死锁处理策略，旨在提升数据库性能和并发处理能力。

摘要由CSDN通过智能技术生成

1.mysql一级、二级索引

一级索引

索引和数据存储在一起，都存储在同一个B+tree中的叶子节点。一般主键索引都是一级索引。

二级索引

二级索引树的叶子节点存储的是主键而不是数据。也就是说，在找到索引后，得到对应的主键，再回到一级索引中找主键对应的数据记录。
一级索引和二级索引的关系：回表
一级索引可以单独存在，二级索引不能单独存在，必须依附于一级索引，这叫做“回表”。
二级索引存储主键值而不是存储数据优缺点
优点：
1、减少数据冗余
2、减少行移动或者数据页分裂时二级索引的维护工作，当数据需要更新的时候，二级索引不需要修改，只需要修改一级索引，一个表只能有一个一级索引，其他的都是二级索引，这样只需要修改一级索引就可以了，不需要重新构建二级索引
缺点：
根据二级索引查找行的完整数据需要回表

2.SQL 优化

2.1优化表结构

（1）尽量使用数字型字段

含数值信息的字段尽量不要设计为字符型，这会降低查询和连接的性能，并会增加存储开销。这是因为引擎在处理查询和连接时会逐个比较字符串中每一个字符，而对于数字型而言只需要比较一次就够了。

（2）尽可能的使用 varchar 代替 char

变长字段存储空间小，可以节省存储空间。

（3）当索引列大量重复数据时，可以把索引删除掉

比如有一列是性别，几乎只有男、女、未知，这样的索引是无效的。

2.2优化查询

应尽量避免在 where 子句中使用!=或<>操作符
应尽量避免在 where 子句中使用 or 来连接条件
任何查询也不要出现select *
避免在 where 子句中对字段进行 null 值判断

2.3索引优化

对作为查询条件和 order by的字段建立索引
避免建立过多的索引，多使用组合索引

3.怎么看执行计划（explain），如何理解其中各个字段的含义？

在 select 语句之前增加 explain 关键字，会返回执行计划的信息。

id 列：是 select 语句的序号，MySQL将 select 查询分为简单查询和复杂查询。
select_type列：表示对应行是是简单还是复杂的查询。
table 列：表示 explain 的一行正在访问哪个表。
type 列：最重要的列之一。表示关联类型或访问类型，即 MySQL 决定如何查找表中的行。从最优到最差分别为：system > const > eq_ref > ref > fulltext > ref_or_null > index_merge > unique_subquery > index_subquery > range > index > ALL
possible_keys 列：显示查询可能使用哪些索引来查找。
key 列：这一列显示 mysql 实际采用哪个索引来优化对该表的访问。
key_len 列：显示了mysql在索引里使用的字节数，通过这个值可以算出具体使用了索引中的哪些列。
ref 列：这一列显示了在key列记录的索引中，表查找值所用到的列或常量，常见的有：const（常量），func，NULL，字段名。
rows 列：这一列是 mysql 估计要读取并检测的行数，注意这个不是结果集里的行数。
Extra 列：显示额外信息。比如有 Using index、Using where、Using temporary等。
索引

4.聚集索引与非聚集索引的区别

（1）一个表中只能拥有一个聚集索引，而非聚集索引一个表可以存在多个。
（2）聚集索引，索引中键值的逻辑顺序决定了表中相应行的物理顺序；非聚集索引，索引中索引的逻辑顺序与磁盘上行的物理存储顺序不同。
（3）索引是通过二叉树的数据结构来描述的，我们可以这么理解聚簇索引：索引的叶节点就是数据节点。而非聚簇索引的叶节点仍然是索引节点，只不过有一个指针指向对应的数据块。
（4）聚集索引：物理存储按照索引排序；非聚集索引：物理存储不按照索引排序；

5.为什么要用 B+ 树，为什么不用普通二叉树？

查询是否够快，效率是否稳定，存储数据多少，以及查找磁盘次数，为什么不是普通二叉树，为什么不是平衡二叉树，为什么不是B树，而偏偏是 B+ 树呢？

（1）为什么不是普通二叉树？

如果二叉树特殊化为一个链表，相当于全表扫描。平衡二叉树相比于二叉查找树来说，查找效率更稳定，总体的查找速度也更快。

（2）为什么不是平衡二叉树呢？

我们知道，在内存比在磁盘的数据，查询效率快得多。如果树这种数据结构作为索引，那我们每查找一次数据就需要从磁盘中读取一个节点，也就是我们说的一个磁盘块，但是平衡二叉树可是每个节点只存储一个键值和数据的，如果是B树，可以存储更多的节点数据，树的高度也会降低，因此读取磁盘的次数就降下来啦，查询效率就快啦。

（3）为什么不是 B 树而是 B+ 树呢？

B+ 树非叶子节点上是不存储数据的，仅存储键值，而B树节点中不仅存储键值，也会存储数据。innodb中页的默认大小是16KB，如果不存储数据，那么就会存储更多的键值，相应的树的阶数（节点的子节点树）就会更大，树就会更矮更胖，如此一来我们查找数据进行磁盘的IO次数有会再次减少，数据查询的效率也会更快。
B+ 树索引的所有数据均存储在叶子节点，而且数据是按照顺序排列的，链表连着的。那么 B+ 树使得范围查找，排序查找，分组查找以及去重查找变得异常简单。