大厂面试官：千万级数据量的表，如何进行快速查询？，2024年最新java初级工程师面试题

最新推荐文章于 2024-05-31 10:46:10 发布

2401_84025139

最新推荐文章于 2024-05-31 10:46:10 发布

阅读量924

点赞数 11

分类专栏： 2024年程序员学习文章标签： java 数据库开发语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/2401_84025139/article/details/137711570

版权

2024年程序员学习专栏收录该内容

239 篇文章 0 订阅

订阅专栏

MySQL分页查询语法如下：

SELECT * FROM table LIMIT [offset,] rows | rows OFFSET offset

第一个参数指定第一个返回记录行的偏移量
第二个参数指定返回记录行的最大数目

下面我们开始测试查询结果：

SELECT * FROM user_operation_log LIMIT 10000, 10

查询3次时间分别为：

59 ms
49 ms
50 ms

这样看起来速度还行，不过是本地数据库，速度自然快点。

换个角度来测试

相同偏移量，不同数据量

SELECT * FROM user_operation_log LIMIT 10000, 10

SELECT * FROM user_operation_log LIMIT 10000, 100

SELECT * FROM user_operation_log LIMIT 10000, 1000

SELECT * FROM user_operation_log LIMIT 10000, 10000

SELECT * FROM user_operation_log LIMIT 10000, 100000

SELECT * FROM user_operation_log LIMIT 10000, 1000000

查询时间如下：

| 数量 | 第一次 | 第二次 | 第三次 |

| — | — | — | — |

| 10条 | 53ms | 52ms | 47ms |

| 100条 | 50ms | 60ms | 55ms |

| 1000条 | 61ms | 74ms | 60ms |

| 10000条 | 164ms | 180ms | 217ms |

| 100000条 | 1609ms | 1741ms | 1764ms |

| 1000000条 | 16219ms | 16889ms | 17081ms |

从上面结果可以得出结束：数据量越大，花费时间越长

相同数据量，不同偏移量

SELECT * FROM user_operation_log LIMIT 100, 100

SELECT * FROM user_operation_log LIMIT 1000, 100

SELECT * FROM user_operation_log LIMIT 10000, 100

SELECT * FROM user_operation_log LIMIT 100000, 100

SELECT * FROM user_operation_log LIMIT 1000000, 100

| 偏移量 | 第一次 | 第二次 | 第三次 |

| — | — | — | — |

| 100 | 36ms | 40ms | 36ms |

| 1000 | 31ms | 38ms | 32ms |

| 10000 | 53ms | 48ms | 51ms |

| 100000 | 622ms | 576ms | 627ms |

| 1000000 | 4891ms | 5076ms | 4856ms |

从上面结果可以得出结束：偏移量越大，花费时间越长

SELECT * FROM user_operation_log LIMIT 100, 100

SELECT id, attr FROM user_operation_log LIMIT 100, 100

如何优化

既然我们经过上面一番的折腾，也得出了结论，针对上面两个问题：偏移大、数据量大，我们分别着手优化

优化偏移量大问题

采用子查询方式

我们可以先定位偏移位置的 id，然后再查询数据

SELECT * FROM user_operation_log LIMIT 1000000,

10SELECT id FROM user_operation_log LIMIT 1000000,

1SELECT * FROM user_operation_log WHERE id >= (

SELECT id FROM user_operation_log LIMIT 1000000,

1

) LIMIT 10

查询结果如下：

| sql | 花费时间 |

| — | — |

| 第一条 | 4818ms |

| 第二条(无索引情况下) | 4329ms |

| 第二条(有索引情况下) | 199ms |

| 第三条(无索引情况下) | 4319ms |

| 第三条(有索引情况下) | 201ms |

从上面结果得出结论：

第一条花费的时间最大，第三条比第一条稍微好点
子查询使用索引速度更快

缺点：只适用于id递增的情况

id非递增的情况可以使用以下写法，但这种缺点是分页查询只能放在子查询里面

注意：某些 mysql 版本不支持在 in 子句中使用 limit，所以采用了多个嵌套select

SELECT * FROM user_operation_log WHERE id IN (

SELECT t.id FROM (

SELECT id FROM user_operation_log LIMIT 1000000,

10

) AS t

)

采用 id 限定方式

这种方法要求更高些，id必须是连续递增，而且还得计算id的范围，然后使用 between，sql如下

SELECT * FROM user_operation_log WHERE id between 1000000 AND 1000100 LIMIT 100SELECT * FROM user_operation_log WHERE id >= 1000000 LIMIT 100

查询结果如下：

| sql | 花费时间 |

| — | — |

| 第一条 | 22ms |

| 第二条 | 21ms |

从结果可以看出这种方式非常快

注意：这里的 LIMIT 是限制了条数，没有采用偏移量

优化数据量大问题

返回结果的数据量也会直接影响速度

SELECT * FROM user_operation_log LIMIT 1, 1000000

SELECT id FROM user_operation_log LIMIT 1, 1000000

SELECT id, user_id, ip, op_data, attr1, attr2, attr3, attr4, attr5, attr6, attr7, attr8, attr9, attr10, attr11, attr12 FROM user_operation_log LIMIT 1, 1000000

查询结果如下：

| sql | 花费时间 |

| — | — |

| 第一条 | 15676ms |

| 第二条 | 7298ms |

| 第三条 | 15960ms |

从结果可以看出减少不需要的列，查询效率也可以得到明显提升

第一条和第三条查询速度差不多，这时候你肯定会吐槽，那我还写那么多字段干啥呢，直接 * 不就完事了

注意本人的 MySQL 服务器和客户端是在_同一台机器_上，所以查询数据相差不多，有条件的同学可以测测客户端与MySQL分开

SELECT * 它不香吗？

自我介绍一下，小编13年上海交大毕业，曾经在小公司待过，也去过华为、OPPO等大厂，18年进入阿里一直到现在。

深知大多数Java工程师，想要提升技能，往往是自己摸索成长或者是报班学习，但对于培训机构动则几千的学费，着实压力不小。自己不成体系的自学效果低效又漫长，而且极易碰到天花板技术停滞不前！

因此收集整理了一份《2024年Java开发全套学习资料》，初衷也很简单，就是希望能够帮助到想自学提升又不知道该从何学起的朋友，同时减轻大家的负担。

既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，基本涵盖了95%以上Java开发知识点，真正体系化！

由于文件比较大，这里只是将部分目录大纲截图出来，每个节点里面都包含大厂面经、学习笔记、源码讲义、实战项目、讲解视频，并且后续会持续更新

如果你觉得这些内容对你有帮助，可以添加V获取：vip1024b （备注Java）

最后

手绘了下图所示的kafka知识大纲流程图（xmind文件不能上传，导出图片展现），但都可提供源文件给每位爱学习的朋友

一个人可以走的很快，但一群人才能走的更远。不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎扫码加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！

记、源码讲义、实战项目、讲解视频，并且后续会持续更新**

如果你觉得这些内容对你有帮助，可以添加V获取：vip1024b （备注Java）
[外链图片转存中…(img-KTTRCt8R-1712979490007)]

最后

手绘了下图所示的kafka知识大纲流程图（xmind文件不能上传，导出图片展现），但都可提供源文件给每位爱学习的朋友

[外链图片转存中…(img-Lma7UyDh-1712979490008)]

一个人可以走的很快，但一群人才能走的更远。不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎扫码加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！
[外链图片转存中…(img-yNgrLJjx-1712979490008)]

关注

11
点赞
踩
11

收藏

觉得还不错? 一键收藏
0
评论
大厂面试官：千万级数据量的表，如何进行快速查询？，2024年最新java初级工程师面试题

手绘了下图所示的kafka知识大纲流程图（xmind文件不能上传，导出图片展现），但都可提供源文件给每位爱学习的朋友一个人可以走的很快，但一群人才能走的更远。不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎扫码加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！记、源码讲义、实战项目、讲解视频，并且后续会持续更新**如果你觉得这些内容对你有帮助，可以添加V获取：vip1024b （备注Java）
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。