MySQL理论常见面试题附带答案-CSDN博客

本文链接：https://blog.csdn.net/qq_41456129/article/details/136581174

1.数据库索引使用原理，为什么要使用B+树索引，而不使用其他的索引

2. MySQL索引使用注意事项

3. InnoDB与MyISAM的区别

4.聚集索引和非聚集索引的区别

1.数据库索引使用原理，为什么要使用B+树索引，而不使用其他的索引

数据库索引的主要目的是提高查询性能，加速数据检索过程。不同的数据库管理系统使用不同的索引结构，而B+树索引是其中一种常见且广泛应用的索引结构。以下是数据库索引使用原理和为何选择B+树索引的解释：

数据库索引使用原理：

提高查询速度： 索引是一种数据结构，通过在数据库表上创建索引，可以显著提高查询速度。索引允许数据库系统快速定位和访问特定数据行，而不需要全表扫描。
降低I/O开销： 通过使用索引，数据库系统可以直接跳过大部分数据，只需读取包含目标数据的部分数据页，从而降低I/O开销，加速数据检索。
支持排序和聚合操作： 索引使得排序和聚合等操作更加高效，因为数据库系统可以直接使用索引中的有序信息，而无需对整个表进行排序或聚合。

为什么使用B+树索引：

有序性： B+树是一种平衡树结构，保持了数据的有序性。这使得范围查询、排序等操作更加高效，因为相关数据在树结构中是有序排列的。
高度平衡： B+树是一种高度平衡的树，每个非叶子节点都有相同的深度。这确保了检索时的平均深度较小，使得查询性能相对稳定。
支持范围查询： B+树的有序性和平衡性使得范围查询非常高效。范围查询涉及到一系列相邻的索引值，而B+树的结构正好支持这样的查询。
适用于范围查询和范围扫描： 在许多应用中，查询往往涉及范围条件，而B+树的结构使得范围查询和范围扫描的性能相对较好。
适合磁盘存储： B+树的叶子节点形成一个有序链表，方便进行范围扫描。这对于磁盘存储尤为重要，因为可以更好地利用磁盘的顺序读取性能。

虽然还有其他类型的索引结构，如哈希索引、全文索引等，但B+树索引在范围查询和磁盘存储上的优势使其成为许多关系型数据库系统的首选索引结构。在选择索引类型时，需根据具体应用场景和查询模式来权衡不同的优势和劣势。

2. MySQL索引使用注意事项

选择合适的列进行索引： 确保选择最经常用于查询的列进行索引。通常是那些用于WHERE子句、JOIN条件和ORDER BY子句的列。
避免在索引列上进行函数操作： 在索引列上进行函数操作会导致索引失效，MySQL无法使用索引优化查询。尽量避免在索引列上使用函数，或者考虑创建函数索引来解决这个问题。
谨慎使用索引覆盖： 索引覆盖是指查询的列都包含在索引中，MySQL可以直接使用索引返回查询结果，而无需访问实际数据行。谨慎使用索引覆盖，因为索引可能占用大量磁盘空间，而且更新索引也会增加额外的开销。
定期分析和优化索引： 定期分析查询性能和索引使用情况，优化已有索引或添加新索引，以确保查询性能的最佳化。
理解不同类型的索引： MySQL支持多种类型的索引，包括B-Tree索引、哈希索引和全文索引等。理解不同类型索引的特点和适用场景，选择最合适的索引类型。
避免创建过多的索引： 创建过多的索引可能会增加写操作的成本，并占用大量磁盘空间。只创建必要的索引，并确保每个索引都能够提高查询性能。
定期检查索引的健康状况： 使用MySQL的性能分析工具（如EXPLAIN语句、MySQL的慢查询日志等）来检查索引的使用情况和性能问题，及时发现并解决潜在的问题。

综上所述，合理设计和使用索引是提高MySQL查询性能的关键。通过理解业务需求、监控索引性能并定期优化索引，可以有效地提高MySQL数据库的性能和可靠性。

3. InnoDB与MyISAM的区别

InnoDB	MyISAM
支持事务	不支持事务
支持外键	不支外键
需要全表扫描	select count(*) from table 时，MyISAM更快，因为它有一个变量保存了整个表的行数，可以直接读取
支持MVCC(多版本并发控制)	不支持
5.7版本之前不支持全文引，5.7版本之后支持全文索引	支持全文索引
支持行级锁、表级锁	支持表级锁
表必须有主键	可以没有主键
需要更多的内存与磁盘	可以被压缩，存储空间较小
按照主键大小有序插入	记录插入顺序，按照记录插入顺序保存
存储引擎提供了提交、回滚、灾难恢复能力的事务安全	写的效率会差一些，并且会占用更多的磁盘空间以保存数据和索引

4.聚集索引和非聚集索引的区别

1.一个表只能有一个聚集索引，而非聚集索引可以存在多个。

2.聚集索引：索引中键值的逻辑顺序决定了表中相应行的物理顺序。

非聚集索引：索引中的逻辑顺序与磁盘上行的物理存储顺序不同。

3. 索引是通过二叉树的数据结构来描述的，可以这样理解聚集索引：索引的节点就是数据节点。而非聚集索引的节点任是索引节点，只不过是有一个指针指向对应的数据块。

4.聚集索引：物理存储按照索引排序；非聚集索引：物理存储不按照索引排序。

5. 什么是幻读，脏读，不可重复读呢？

幻读、脏读和不可重复读都是数据库事务处理中可能出现的问题，它们分别涉及到了事务的隔离性和一致性。以下是这三个概念的具体解释：

幻读（Phantom Read）：
幻读发生在当一个事务读取了几行数据，接着另一个并发事务插入新行，然后第一个事务再次读取同样的范围时，看到了这些新的“幻影”行。具体来说，事务A首先根据条件索引得到N条数据，然后事务B改变了这N条数据之外的M条或者增添了M条符合事务A搜索条件的数据，导致事务A再次搜索发现有N+M条数据。这就是幻读现象。幻读主要存在于可重复读（RR）的事务隔离级别中。
脏读（Dirty Read）：
脏读发生在当一个事务正在访问数据，并且对数据进行了修改，而这种修改还没有提交到数据库中时，另一个事务也访问这个数据，并使用了这个未提交的数据。因为这个数据是还没有提交的数据，所以另一个事务读到的这个数据是“脏”数据，依据脏数据所做的操作可能是不正确的。脏读一般针对update操作，它违反了数据库事务的隔离性。
不可重复读（Non-repeatable Read）：
不可重复读是指在数据库访问中，一个事务范围内两个相同的查询却返回了不同数据。这是由于查询时系统中其他事务修改的提交而引起的。例如，事务T1读取某一数据，事务T2读取并修改了该数据，T1为了对读取值进行检验而再次读取该数据，便得到了不同的结果。这种情况违反了数据库事务的一致性。

为了避免这些问题，数据库管理系统（DBMS）提供了不同的事务隔离级别，例如读未提交、读已提交、可重复读和串行化。这些隔离级别可以帮助数据库管理员和开发者根据应用程序的需求选择适当的事务处理方式

6.事务的隔离级别有哪些？MySQL的默认隔离级别是什么？

事务的隔离级别主要用于定义事务之间的可见性，它决定了在并发操作中，一个事务的执行对其他事务的影响程度。数据库的隔离级别从低到高依次包括：

读未提交（Read Uncommitted）：这是最低的隔离级别。在这个级别下，一个事务可以读取到另一个未提交事务的修改。这可能导致脏读、不可重复读和幻读等问题。
读已提交（Read Committed）：这是大多数主流数据库的默认隔离级别，例如Oracle。它确保了一个事务只能读取到已经提交的数据。这可以避免脏读，但可能出现不可重复读和幻读。
可重复读（Repeatable Read）：这个级别保证在同一个事务内的查询都是事务开始时刻一致的。它避免了脏读和不可重复读的问题，但在SQL标准中，它仍可能存在幻读。然而，在MySQL的InnoDB存储引擎中，通过多版本并发控制（MVCC）技术，幻读问题也得到了解决。
串行化（Serializable）：这是最高的隔离级别。它通过强制事务串行执行，从而解决了脏读、不可重复读和幻读的问题。但这也带来了最大的性能损失，因为并发事务之间的执行被完全阻塞。

MySQL的默认隔离级别是可重复读（Repeatable Read）。这个级别在MySQL的InnoDB存储引擎中表现尤其出色，因为它通过MVCC技术有效地解决了幻读问题，从而提供了较好的并发性能和数据一致性保证。然而，需要注意的是，不同的MySQL存储引擎可能使用不同的默认隔离级别，所以在实际使用中，最好明确指定所需的隔离级别，以避免潜在的问题。

7.MVCC熟悉吗，它的底层原理？

MVCC（Multi-Version Concurrency Control，多版本并发控制）是一种数据库管理系统中的并发控制方法，它使得读和写操作可以并发执行，同时保持数据的一致性和隔离性。MVCC通过保存数据的一个或多个版本，使得读写操作没有冲突，因此可以对同一份数据同时进行读写操作，无需加锁。

MVCC的底层原理主要包括以下几个方面：

数据版本化：在MVCC中，每当数据发生变化时，不会直接修改原始数据，而是生成数据的一个新版本。每个版本的数据都包含创建时间戳或事务ID等信息，以便在后续操作中识别和使用。
读写操作的无锁性：由于数据有多个版本，读操作可以读取一个与当前事务一致的数据版本，而写操作则创建新的数据版本，因此读写操作之间不会产生锁竞争。这大大提高了数据库的并发性能。
版本管理：数据库系统需要维护数据的版本信息，以便在需要时能够找到正确的数据版本。这通常通过维护一个版本链或类似的数据结构来实现，每个版本都指向其前一个版本。
一致性视图：当执行读操作时，数据库系统会根据当前事务的ID和系统中的其他事务信息，生成一个一致性视图。这个视图决定了读操作应该看到哪些版本的数据。通过这种方式，读操作可以看到一个一致的数据快照，即使其他事务正在进行写操作。
垃圾回收：随着时间的推移，一些旧的数据版本可能不再需要，因为没有任何事务会再引用它们。数据库系统会定期清理这些不再需要的数据版本，以释放存储空间。

在MySQL中，InnoDB存储引擎实现了MVCC机制。它通过在每行数据中添加隐藏字段来维护版本信息，并使用Undo日志来记录数据的修改历史。当进行读操作时，InnoDB会根据当前事务的一致性视图来确定读取哪个版本的数据；当进行写操作时，它会生成新的数据版本并更新到数据行中。

总的来说，MVCC通过保存数据的多个版本和生成一致性视图，实现了读写操作的并发执行，提高了数据库的并发性能，同时保证了数据的一致性和隔离性。

8.MySQL主从复制原理

MySQL主从复制原理主要基于二进制日志（Binary Log）和主从服务器之间的数据同步。以下是详细的解释：

二进制日志（Binary Log）：
- 主数据库（Master）上的所有增删改操作（DDL和DML）都会被记录到二进制日志中。这些日志包含了数据库更改的所有信息，用于后续从库的复制操作。
- 当主库上的数据发生变化时，这些变化会被顺序地写入到binlog里面。从库连接到主库时，会从主库拉取这些binlog内容进行复制操作。
主从复制过程：
- 主库binlog输出线程：每当有从库连接到主库时，主库会创建一个线程用于发送binlog内容到从库。对于主库每一个即将发送给从库的SQL事件，binlog输出线程会将其锁住，直到该事件被从库读取完毕并确认后，锁才会被释放。
- 从库的I/O线程：当从库开始执行START SLAVE语句后，它会创建一个I/O线程连接到主库，并请求主库发送binlog中的更新记录到从库。从库通过I/O线程接收主库的binlog日志，并写入到本地的中继日志（Relay Log）中。
- 从库的SQL线程：从库的SQL线程读取中继日志中的事件，并重新执行这些事件，从而使得从库的数据与主库保持一致。
复制类型：
- 异步复制：MySQL默认使用异步复制，意味着主库发送更新事件到从库后，不会等待从库确认即继续处理其他事务。这可能导致短暂的数据不一致，但从性能角度考虑通常是可以接受的。
- 半同步复制：这是异步复制的改进版，主库在发送更新事件后会等待至少一个从库确认接收并写入其中继日志后才继续处理其他事务。这提高了数据的可靠性，但可能会稍微降低性能。
注意事项：
- 当涉及时间函数或系统函数时，由于复制过程中的IO操作、网络延迟、磁盘效率等因素，可能会导致从库与主库的数据不一致。
- 为了确保数据的一致性，有时需要谨慎处理这些函数的使用，或者采取其他同步策略。