mysql 分页面试题_Mysql面试题：为什么分页场景下，请求速度非常慢？

最新推荐文章于 2024-08-31 23:26:36 发布

韩鱼

最新推荐文章于 2024-08-31 23:26:36 发布

阅读量172

点赞数

文章标签： mysql 分页面试题

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_35949298/article/details/113437760

版权

从一个问题说起

五年前在腾讯的时候，发现分页场景下，mysql请求速度非常慢。数据量只有10w的情况下，select xx from 单机大概2，3秒。我就问我师父为什么，他反问“索引场景，mysql中获得第n大的数，时间复杂度是多少？”

答案的追寻

确认场景

假设status上面有索引。select * from table where status = xx limit 10 offset 10000。会非常慢。数据量不大的情况就有几秒延迟。

小白作答

那时候非常有安全感，有啥事都有师父兜着，反正技术都是组里最差的，就瞎猜了个log(N)，心想找一个节点不就是log(N)。自然而然，师父让我自己去研究。这一阶段，用了10分钟。

继续解答

仔细分析一下，会发现通过索引去找很别扭。因为你不知道前100个数在左子树和右子数的分布情况，所以其是无法利用二叉树的查找特性。通过学习，了解到mysql的索引是b+树。

看了这个图，就豁然开朗了。可以直接通过叶子节点组成的链表，以o(n)的复杂度找到第100大的树。但是即使是o(n)，也不至于慢得令人发指，是否还有原因。

这一阶段，主要是通过网上查资料，断断续续用了10天。

系统学习

这里推荐两本书，一本《MySQL技术内幕 InnoDB存储引擎》，通过他可以对InnoDB的实现机制，如mvcc，索引实现，文件存储会有更深理解。第二本是《高性能MySQL》，这本书从着手使用层面，但讲得比较深入，而且提到了很多设计的思路。两本书相结合，反复领会，mysql就勉强能登堂入室了。这里有两个关键概念：

聚簇索引：包含主键索引和对应的实际数据，索引的叶子节点就是数据节点

辅助索引：可以理解为二级节点，其叶子节点还是索引节点，包含了主键id。

即使前10000个会扔掉，mysql也会通过二级索引上的主键id,去聚簇索引上查一遍数据，这可是10000次随机io，自然慢成哈士奇。

这里可能会提出疑问，为什么会有这种行为，这是和mysql的分层有关系，limit offset 只能作用于引擎层返回的结果集。换句话说，引擎层也很无辜，他并不知道这10000个是要扔掉的。以下是mysql分层示意图，可以看到，引擎层和server层，实际是分开的。

直到此时，大概明白了慢的原因。这一阶段，用了一年。

触类旁通

此时工作已经3年了，也开始看一些源码。在看完etcd之后，看了些tidb的源码。无论哪种数据库，其实一条语句的查询，是由逻辑算子组成。逻辑算子介绍在写具体的优化规则之前，先简单介绍查询计划里面的一些逻辑算子。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。