面试官：MySQL数据查询太多会OOM吗(1)，2024年最新java程序员面试简历

最新推荐文章于 2024-08-22 20:42:12 发布

2401_84006689

最新推荐文章于 2024-08-22 20:42:12 发布

阅读量518

点赞数 23

分类专栏： 2024年程序员学习文章标签： mysql java 面试

本文链接：https://blog.csdn.net/2401_84006689/article/details/137898233

版权

2024年程序员学习专栏收录该内容

246 篇文章 0 订阅

订阅专栏

先自我介绍一下，小编浙江大学毕业，去过华为、字节跳动等大厂，目前阿里P7

深知大多数程序员，想要提升技能，往往是自己摸索成长，但自己不成体系的自学效果低效又漫长，而且极易碰到天花板技术停滞不前！

因此收集整理了一份《2024年最新Java开发全套学习资料》，初衷也很简单，就是希望能够帮助到想自学提升又不知道该从何学起的朋友。

既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，涵盖了95%以上Java开发知识点，真正体系化！

由于文件比较多，这里只是将部分目录截图出来，全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频，并且后续会持续更新

如果你需要这些资料，可以添加V获取：vip1024b （备注Java）

正文

每日技术干货，第一时间送达！

我的主机内存只有100G，现在要全表扫描一个200G大表，会不会把DB主机的内存用光？

逻辑备份时，可不就是做整库扫描吗？若这样就会把内存吃光，逻辑备份不是早就挂了？

所以大表全表扫描，看起来应该没问题。这是为啥呢？

1、全表扫描对server层的影响

假设，我们现在要对一个200G的InnoDB表db1. t，执行一个全表扫描。当然，你要把扫描结果保存在客户端，会使用类似这样的命令：

mysql -h $h os t - P$ port -u $u ser - p$ pwd -e

“select * from db1.t” > $target_file

InnoDB数据保存在主键索引上，所以全表扫描实际上是直接扫描表t的主键索引。这条查询语句由于没有其他判断条件，所以查到的每一行都可以直接放到结果集，然后返回给客户端。

那么，这个“结果集”存在哪里呢？

服务端无需保存一个完整结果集。取数据和发数据的流程是这样的：

获取一行，写到net_buffer。这块内存的大小是由参数net_buffer_length定义，默认16k
重复获取行，直到net_buffer写满，调用网络接口发出去
若发送成功，就清空net_buffer，然后继续取下一行，并写入net_buffer
若发送函数返回EAGAIN或WSAEWOULDBLOCK，就表示本地网络栈（socket send buffer）写满了，进入等待。直到网络栈重新可写，再继续发送

查询结果发送流程：

可见：

一个查询在发送过程中，占用的MySQL内部的内存最大就是net_buffer_length这么大，不会达到200G
socket send buffer 也不可能达到200G（默认定义/proc/sys/net/core/wmem_default），若socket send buffer被写满，就会暂停读数据的流程

所以MySQL其实是“边读边发”。这意味着，若客户端接收得慢，会导致MySQL服务端由于结果发不出去，这个事务的执行时间变长。

比如下面这个状态，就是当客户端不读socket receive buffer内容时，在服务端show processlist看到的结果。

服务端发送阻塞：

若看到State一直是“Sending to client”，说明服务器端的网络栈写满了。

若客户端使用–quick参数，会使用mysql_use_result方法：读一行处理一行。假设某业务的逻辑较复杂，每读一行数据以后要处理的逻辑若很慢，就会导致客户端要过很久才取下一行数据，可能就会出现上图结果。

因此，对于正常的线上业务来说，若一个查询的返回结果不多，推荐使用mysql_store_result接口，直接把查询结果保存到本地内存。

当然前提是查询返回结果不多。如果太多，因为执行了一个大查询导致客户端占用内存近20G，这种情况下就需要改用mysql_use_result接口。

若你在自己负责维护的MySQL里看到很多个线程都处于“Sending to client”，表明你要让业务开发同学优化查询结果，并评估这么多的返回结果是否合理。

若要快速减少处于这个状态的线程的话，可以将net_buffer_length设置更大。

有时，实例上看到很多查询语句状态是“Sending data”，但查看网络也没什么问题，为什么Sending data要这么久？

一个查询语句的状态变化是这样的：

MySQL查询语句进入执行阶段后，先把状态设置成 Sending data
然后，发送执行结果的列相关的信息（meta data) 给客户端
再继续执行语句的流程
执行完成后，把状态设置成空字符串

即“Sending data”并不一定是指“正在发送数据”，而可能是处于执行器过程中的任意阶段。比如，你可以构造一个锁等待场景，就能看到Sending data状态。

读全表被锁：

session 1	session2
begin select * from t where id=1 for update	启动事务
	select * from t lock in share mode (blocked)

Sending data状态

可见session2是在等锁，状态显示为Sending data。

仅当一个线程处于“等待客户端接收结果”的状态，才会显示"Sending to client"
若显示成“Sending data”，它的意思只是“正在执行”

所以，查询的结果是分段发给客户端，因此扫描全表，查询返回大量数据，并不会把内存打爆。

以上是server层的处理逻辑，在InnoDB引擎里又是怎么处理？

2、全表扫描对InnoDB的影响

InnoDB内存的一个作用，是保存更新的结果，再配合redo log，避免随机写盘。

内存的数据页是在Buffer Pool (简称为BP)管理，在WAL里BP起加速更新的作用。

BP还能加速查询。

由于WAL，当事务提交时，磁盘上的数据页是旧的，若这时马上有个查询来读该数据页，是不是要马上把redo log应用到数据页？

不需要。因为此时，内存数据页的结果是最新的，直接读内存页即可。这时查询无需读磁盘，直接从内存取结果，速度很快。所以，Buffer Pool能加速查询。

而BP对查询的加速效果，依赖于一个重要的指标，即：内存命中率。

可以在show engine innodb status结果中，查看一个系统当前的BP命中率。一般情况下，一个稳定服务的线上系统，要保证响应时间符合要求的话，内存命中率要在99%以上。

难道这样就够了吗？不，远远不够！

提前多熟悉阿里往年的面试题肯定是对面试有很大的帮助的，但是作为技术性职业，手里有实打实的技术才是你面对面试官最有用的利器，这是从内在散发出来的自信。

备战阿里时我花的最多的时间就是在学习技术上，占了我所有学习计划中的百分之70，这是一些我学习期间觉得还是很不错的一些学习笔记

我为什么要写这篇文章呢，其实我觉得学习是不能停下脚步的，在网络上和大家一起分享，一起讨论，不单单可以遇到更多一样的人，还可以扩大自己的眼界，学习到更多的技术，我还会在csdn、博客、掘金等网站上分享技术，这也是一种学习的方法。

今天就分享到这里了，谢谢大家的关注，以后会分享更多的干货给大家！

阿里一面就落马，恶补完这份“阿里面试宝典”后，上岸蚂蚁金服

网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。

需要这份系统化的资料的朋友，可以添加V获取：vip1024b （备注Java）

一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！
13383585376)]

网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。

需要这份系统化的资料的朋友，可以添加V获取：vip1024b （备注Java）
[外链图片转存中…(img-3kumSsyV-1713383585376)]

一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！

2401_84006689

关注

23
点赞
踩
11

收藏

觉得还不错? 一键收藏
0
评论
面试官：MySQL数据查询太多会OOM吗(1)，2024年最新java程序员面试简历

我为什么要写这篇文章呢，其实我觉得学习是不能停下脚步的，在网络上和大家一起分享，一起讨论，不单单可以遇到更多一样的人，还可以扩大自己的眼界，学习到更多的技术，我还会在csdn、博客、掘金等网站上分享技术，这也是一种学习的方法。提前多熟悉阿里往年的面试题肯定是对面试有很大的帮助的，但是作为技术性职业，手里有实打实的技术才是你面对面试官最有用的利器，这是从内在散发出来的自信。因此，对于正常的线上业务来说，若一个查询的返回结果不多，推荐使用mysql_store_result接口，直接把查询结果保存到本地内存。
复制链接

扫一扫