数据库优化和实施-CSDN博客

本文链接：https://blog.csdn.net/weixin_62969822/article/details/140186277

使用MySQL自动的执行计划explain来查看SQL的执行情况，具体包括：

索引定义：帮助MySQL高效获取数据的数据结构，主要用于提高数据检索效率，降低数据库的IO成本、数据排序成本和CPU消耗。
底层数据结构：MySQL的默认存储引擎InnoDB采用B +树的数据结构来存储索引，选择B +树的原因包括阶数更多、路径更短、磁盘读写代价更低、便于扫库和区间查询。
B树和B +树的区别：
- B树中，非叶子节点和叶子节点都会存放数据；B +树的所有数据都会出现在叶子节点，查询时查找效率更加稳定。
- 在进行范围查询时，B +树效率更高，因为B +树的叶子节点存储数据，且叶子节点是一个双向链表。
聚簇索引和非聚簇索引：
- 聚簇索引是指数据与索引放到一块，B +树的叶子节点保存了整行数据，有且只有一个，一般情况下主键作为聚簇索引。
- 非聚簇索引是指数据与索引分开存储，B +树的叶子节点保存对应的主键，可以有多个，一般自己定义的索引都是非聚簇索引。
回表查询：通过二级索引找到对应的主键值，然后再通过主键值找到聚集索引中所对应的整行数据的过程。
覆盖索引：指select查询语句使用了索引，在返回的列在索引中全部能够找到。使用id查询会直接走聚集索引查询，性能高。应尽量避免使用select *，尽量在返回的列中都包含添加索引的字段。

采用覆盖索引和子查询来解决，先分页查询数据的id字段，确定id之后，再用子查询来过滤，只查询这个id列表中的数据。因为查询id的时候走的覆盖索引，所以效率可以提升很多。

建表时：参考阿里开发手册《嵩山版》，结合字段内容选择合适的类型，如数值类型（tinyint、int、bigint等）和字符串类型（char、varchar、text等）。
使用索引时：参考索引创建原则进行优化。
SQL语句编写：
- SELECT语句务必指明字段名称，不要直接使用select *。
- 注意SQL语句避免造成索引失效的写法。
- 聚合查询尽量用union all代替union，因为union会多一次过滤，效率比较低。
- 表关联尽量使用inner join，不要使用left join和right join，如必须使用，一定要以小表为驱动。
主从复制、读写分离。
数据量比较大时，考虑分库分表。

事务的特性：ACID，分别指原子性、一致性、隔离性、持久性。
- 原子性体现在事务操作要么都成功，要么都失败。
- 一致性体现在事务过程中数据要一致。
- 隔离性体现在事务之间不能相互干扰。
- 持久性体现在事务提交后要把数据持久化。
并发事务带来的问题：
- 脏读：一个事务读取到另一个事务未提交的数据，该数据可能是“脏数据”。
- 不可重复读：在一个事务内多次读同一数据，由于另一个事务的修改导致两次读取的数据不太一样。
- 幻读：一个事务读取了几行数据后，另一个并发事务插入了一些数据，导致第一个事务发现多了一些原本不存在的记录。
解决问题的方法：对事务进行隔离，MySQL支持四种隔离级别：
- 未提交读（read uncommitted）：解决不了脏读、不可重复读和幻读问题，一般项目中不用。
- 读已提交（read committed）：能解决脏读问题，但解决不了不可重复读和幻读问题。
- 可重复读（repeatable read）：能解决脏读和不可重复读问题，但解决不了幻读问题，是MySQL默认的隔离级别。
- 串行化（serializable）：可以解决所有问题，但事务串行执行，性能比较低。

事务的隔离性是由锁和MVCC（多版本并发控制）实现的。MVCC的底层实现主要分为三个部分：

隐藏字段：在MySQL中给每个表都设置了隐藏字段，包括事务id（trx_id）和回滚指针（roll_pointer）。
undo log日志：记录回滚日志，存储老版本数据，在内部会形成一个版本链。
readView读视图：解决事务查询选择版本的问题，在内部定义了匹配规则和当前的事务id，判断该访问哪个版本的数据。不同的隔离级别快照读不一样，最终的访问结果也不一样。

十一、MySQL主从同步原理

MySQL主从复制的核心是二进制日志（DDL语句和DML语句），具体步骤为：

项目中根据业务进行数据库的垂直拆分，每个微服务对应一个数据库。
曾经使用过水平分库，当业务量迅速增长，某表数据超过1000万且性能变慢时，采用了水平分库。通过mycat作为数据库中间件，按照id（自增）取模的方式存取数据，并对旧数据进行清洗和按照id取模规则分别存储到各个数据库中，以分摊存储和读取的压力，解决性能问题。