MYSQL 那点破事~ 索引、SQL调优、事务、B+树(1)

  • 唯一索引:索引列的值必须唯一,但允许有空值

  • 复合索引:多列值组成一个索引,专门用于组合搜索,其效率大于索引合并

  • 聚簇索引:也称为主键索引,是一种数据存储方式。B+Tree结构,非叶子节点包含健值和指针,叶子节点包含索引列和行数据。一张表只能有一个聚簇索引。

  • 非聚簇索引:不是聚簇索引,就是非聚簇索引。叶子节点只是存索引列和主键id。如果sql还要返回除了索引列的其他字段信息,需要回表,第一次索引一般是顺序IO,回表的操作属于随机IO。回表的次数越多,性能越差。此时我们推荐覆盖索引

什么是覆盖索引和回表?

答案:

1、覆盖索引,指的是在一次查询中,一个索引包含所有需要查询的字段的值,可能是返回值或where条件

select buyer_id from order where money>100

假如我们创建了一个(money,buyer_id)的联合索引,索引的叶子节点包含了buyer_id的信息,则不会再回表查询。

2、回表,指查询时一些字段值拿不到,需要到主键索引B+树再查一次。

Mysql的最左前缀原则?

答案:即最左优先,在检索数据时从联合索引的最左边开始匹配,直到遇到范围查询(如:> 、< 、between、like等)

例子:where a = 1 and b = 2 and c > 3 and d = 4 ,如果建立(a,b,c,d)组合索引,d是用不到索引的;如果建立(a,b,d,c)的索引则都可以用到,a,b,d的顺序可以任意调整。

线上SQL的调优经验?

答案:

  • 1、slow_query_log 日志中收集到的慢 SQL ,结合 explain 分析是否命中索引。

  • 2、减少索引扫描行数,有针对性的优化慢 SQL。

  • 3、建立联合索引,由于联合索引的每个叶子节点包含检索字段的信息,按最左前缀原则匹配后,再按其它条件过滤,减少回表的数据量。

  • 4、还可以使用虚拟列和联合索引来提升复杂查询的执行效率。

官方为什么建议采用自增id 作为主键?

答案:自增id是连续的,插入过程也是顺序的,总是插入在最后,减少了页分裂,有效减少数据的移动。所以尽量不要使用字符串(如:UUID)作为主键。

索引为什么采用B+树,而不用B-树,红黑树?

答案:提升查询速度,首先要减少磁盘IO次数,也就是要降低树的高度。

  • 平衡二叉树、红黑树,都属于二叉树。时间复杂度为O(n),当表的数据量上千万时,树的深度很深,mysql读取时消耗大量 IO。另外,InnoDB引擎采用为单位读取,每个节点一页,但是二叉树每个节点储存一个关键词,导致空间浪费。

  • B-树,非叶子节点存储数据,占用较多空间,导致每个节点的指针少很多,无形增加了树的深度。

  • B+树数据都存储在叶子节点,非叶子节点只存储健值+指针,索引树更加扁平,三层深度可以支持千万级表存储。同时叶子节点之间通过链表关联,范围查找更快。

  • 更多内容,参考 mysql 一棵 B+ 树能存多少条数据?

事务的特性有哪些?

答案:ACID。

  • 原子性。一个事务中的操作要么全部成功,要么全部失败。

  • 持久性。永久保存在数据库中。

  • 一致性。总是从一个一致性的状态转换到另一个一致性的状态

  • 隔离性。一个事务的修改在提交前,其他事务是感知不到的

如何实现分布式事务?

答案:

  • 1、流水任务,最终一致性,前提是接口要支持幂等性

  • 2、事务消息

  • 3、二阶段提交

  • 4、三阶段提交

  • 5、TCC

  • 6、Seata 框架

日常工作中,MySQL 如何做优化?

答案:

  • 1、分页优化。比如电梯直达,limit 100000,10 先查找起始的主键id,再通过id>#{value}往后取10条

  • 2、尽量使用覆盖索引,索引的叶节点中已经包含要查询的字段,减少回表查询

  • 3、SQL优化(索引优化、小表驱动大表、虚拟列、适当增加冗余字段减少连表查询、联合索引、排序优化、慢日志 Explain 分析执行计划)。

  • 4、设计优化(避免使用NULL、用简单数据类型如int、减少 text 类型、分库分表)。

  • 5、硬件优化(使用SSD 减少 I/O 时间、足够大的网络带宽、尽量大的内存)

mysql 主从同步具体过程?

答案:

  • master主库,有数据更新,将此次更新的事件类型写入到主库的binlog文件中

  • 主库会创建log dump 线程通知slave有数据更新

  • slave,向master节点的 log dump线程请求一份指定binlog文件位置的副本,并将请求回来的binlog存到本地的Relay log 中继日志中

  • slave 再开启一个SQL 线程读取Relay log事件,并在本地执行redo操作。将发生在主库的事件在本地重新执行一遍,从而保证主从数据同步

图片

什么是主从延迟?

答案:指一个写入SQL操作在主库执行完后,将数据完整同步到从库会有一个时间差,称之为主从延迟。计算公式:

  • 主库生成一条写入SQL的binlog,里面会有一个时间字段,记录写入的时间戳 t1

  • binlog 同步到从库后,一旦开始执行,取当前时间 t2

  • t2-t1,就是延迟时间

注意:不同服务器要保持时钟一致

主从延迟排查方法?

答案:通过 show slave status 命令输出的Seconds_Behind_Master参数的值来判断

图片

  • 为零:表示主从复制良好

  • 正值:表示主从已经出现延时,数字越大,表示从库延迟越严重

主从延迟要怎么解决?

答案:

  • 看业务的接受程度。如果不能接受延迟,那么建议强制走主库查询

  • 可以考虑引入缓存,更新主库后同步写入缓存,保证缓存的及时性

  • 提升从库的机器配置,提高从库binlog的同步效率

  • 缩短主、从库的网络距离,减少binlog的网络传输时间

总结

面试难免让人焦虑不安。经历过的人都懂的。但是如果你提前预测面试官要问你的问题并想出得体的回答方式,就会容易很多。

此外,都说“面试造火箭,工作拧螺丝”,那对于准备面试的朋友,你只需懂一个字:刷!

给我刷刷刷刷,使劲儿刷刷刷刷刷!今天既是来谈面试的,那就必须得来整点面试真题,这不花了我整28天,做了份“Java一线大厂高岗面试题解析合集:JAVA基础-中级-高级面试+SSM框架+分布式+性能调优+微服务+并发编程+网络+设计模式+数据结构与算法等”

image

且除了单纯的刷题,也得需准备一本【JAVA进阶核心知识手册】:JVM、JAVA集合、JAVA多线程并发、JAVA基础、Spring 原理、微服务、Netty与RPC、网络、日志、Zookeeper、Kafka、RabbitMQ、Hbase、MongoDB、Cassandra、设计模式、负载均衡、数据库、一致性算法、JAVA算法、数据结构、加密算法、分布式缓存、Hadoop、Spark、Storm、YARN、机器学习、云计算,用来查漏补缺最好不过。

image

+数据结构与算法等”

[外链图片转存中…(img-9GWYoyrt-1714422950627)]

且除了单纯的刷题,也得需准备一本【JAVA进阶核心知识手册】:JVM、JAVA集合、JAVA多线程并发、JAVA基础、Spring 原理、微服务、Netty与RPC、网络、日志、Zookeeper、Kafka、RabbitMQ、Hbase、MongoDB、Cassandra、设计模式、负载均衡、数据库、一致性算法、JAVA算法、数据结构、加密算法、分布式缓存、Hadoop、Spark、Storm、YARN、机器学习、云计算,用来查漏补缺最好不过。

[外链图片转存中…(img-zRS0nDew-1714422950628)]

本文已被CODING开源项目:【一线大厂Java面试题解析+核心总结学习笔记+最新讲解视频+实战项目源码】收录

  • 8
    点赞
  • 18
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值