mysql Query 的优化—Join的实现原理及优化思路

最新推荐文章于 2023-12-27 14:29:05 发布

小洪帽i

最新推荐文章于 2023-12-27 14:29:05 发布

阅读量696

点赞数 1

分类专栏： MySQL 面试参考题文章标签： mysql

原文链接：https://blog.csdn.net/niclascage/article/details/48009161

版权

MySQL 同时被 2 个专栏收录

86 篇文章 4 订阅

订阅专栏

面试参考题

13 篇文章 0 订阅

订阅专栏

本文深入探讨了MySQL中NestedLoopJoin的实现原理，指出Join优化的关键在于减少循环次数，特别是优化内层循环。建议始终使用小结果集驱动大结果集，并确保Join条件字段有索引。在内存允许的情况下，适当增大JoinBuffer能提升性能。JoinBuffer避免了并发访问cache的问题，加快执行速度。

摘要由CSDN通过智能技术生成

Join 的实现原理

在寻找 Join 语句的优化思路之前，我们首先要理解 MySQL 中是如何来实现 Join 的，只要理解了实现原理之后，优化就比较简单了。

在 MySQL 中，只有一种 Join 算法，减少大名鼎鼎的 Nested Loop Join , Nested Loop Join 实际上就是通过驱动表的结果集作为循环基础数据，然后一条一条的通过该结果集中的数据作为过滤条件到下一个表中查询数据，然后合并结果。如果还有第三个参与 Join ，则通过前两个表的 Join 结果集作为循环基础数据，再一次通过循环查询条件到第三个表中查询数据，第四个 Join 、第五个 Join 都是按照前面的结果集作为循环的基础数据，再去通过循环查询得到最终的数据，以此类推。

join 语句的优化

尽可能减少 Join 语句中的 Nested Loop 的循环总次数；

如何减少 Nested Loop 的循环次数？最有效的办法只有一个，那就是让驱动表的结果集尽可能的小，这也正是在本章第二节中的优化基本原则之一 “永远用小结果集驱动大的结果集”。

当然，此优化的前提条件是通过 Join 条件对各表的每次访问的资源消耗差别不是太大。如果访问存在较大的差别的时候（一般都是因为索引的区别），我们就不能简单的通过结果集的大小来判断需要 Join 语句的驱动顺序，而是要通过比较循环次数和每次循环所需的消耗的乘积的大小来得到如何驱动更优化。