达梦-浅谈多表连接

本文介绍了达梦数据库中嵌套循环、HASH连接和排序合并连接的区别,通过实例演示了小表驱动大表的连接策略,以及在不同情况下如何选择合适的连接方式。重点讨论了等值连接与不等值连接的索引影响,以及大表连接大表时的过滤条件优化。
摘要由CSDN通过智能技术生成

作为一个达梦的初学者,写这篇文章的目的是为了把学到的新知识做个总结梳理,在整理中查缺补漏,也希望大家看了我的文章能有收获,如有错误的地方欢迎指出。

------------------------------------------------------------------------------------------------------------------------------

与其他关系型数据库一样,达梦数据库中的多表连接主要以下三种:嵌套循环、Hash连接和排序合并连接

一、基本概念

        嵌套循环:依靠两层嵌套循环(分别为外层循环和内存循环)来得到连接结果集的表连接方法。即外层循环对应的驱动结果集有多少条记录,遍历被驱动表的内层循环就要做多少次。在达梦中的标识符为

        HASH连接:同样是选择两个数据结果集⽐较⼩的那个作为驱动表,在连接列上创建⼀个摆放在内存⾥的hash表,然后使⽤唯⼀性的hash函数来指定每⼀⾏在hash表⾥的存放位置。然后数据库会扫描⼤的那个数据集,探测hash表,找到匹配的⾏。

排序合并连接:通过连接列先分别排序后, 再通过合并操作来得到最后返回的结果集。

其中排序合并连接大部分场景下都能被上述两种替换掉,下面就不针对这种连接方式做分析。

二、创建测试数据

模拟进销存的业务创建以下表单:c_store 店仓表、m_product商品表、m_retail零售头表、m_retailitem零售明细表、m_transferitem调拨明细表。

说明:零售表头记录了店仓表的ID、零售明细表和调拨明细表记录了商品表ID  

数据条目数:

三、模拟小表关联大表

执行以下SQL:

select *
from c_Store c,m_retail m
where c.id = m.c_store_id

--未创建任何索引时的执行计划

--基于上述情况,改写SQL,将where条件改为 c.id>m.c_store_id

 --SQL恢复成等值连接,并在m_retail表单的c_Store_id字段上创建了索引后的执行计划

(创建索引语句:create index ind_retaill_001 on m_retail(c_Store_id);)

根据上述测试可以发现:

        小表连接大表时,小表都会作为驱动表;

        等值连接时:在被驱动表上的关联字段上无适合索引时会走HASH JOIN,有适合索引时则会走NESTED LOOP。

        不等值连接时:有无索引都会走NESTED LOOP。        

        NESTED LOOP时对被驱动表的扫描次数为小表的条目数,扫描的效率由被驱动表上的索引决定。因为是那关联条件去扫描,所以非等值连接不受影响。

四、模拟大表连接大表

执行以下SQL

select *
from m_transferitem  m,M_RETAILitem a
where m.m_product_id = a.m_product_id
and m.OWNERID in (895);--单据创建用户ID为895

不创建任何索引,执行计划如下:

在m_retailitem表的m_product_id上创建索引,执行计划如下:

 

创建索引create index idx_transferitem_ownerid on m_transferitem(OWNERID)后,执行计划如下(OWNERID具有很好的过滤性,OWNERID=895的有4000条数据):

这里需要注意执行计划中有一个ACTRL操作符节点,它说明优化器为这一条SQL语句生成了备用计划。ACTRL是控制备用计划转换的操作符,其上面一层NEST LOOP INDEX JOIN2为默认的主计划,再上面一层HASH2 INNER JOIN则为备用计划。ACTRL操作符计算下层孩子节点的代价,决定采用默认主计划还是备用计划。这就涉及到另外一个概念:数据倾斜,代价的计算是通过正确的统计信息才能保证合理,

也可以强制走HASH JOIN,SQL和对应的如下图:

select /*+ use_hash(m,a)*/ *
from m_transferitem  m,M_RETAILitem a
where m.m_product_id = a.m_product_id
and m.OWNERID in (895);

 

 

根据上述测试可以发现:

        大表连接大表时,如果其中一张表上有好的过滤条件且对应的索引来缩小结果集,是可以当做小表来处理,作为驱动表去遍历大表。不过达梦会根据代价去选择进行哪种连接方式。

        HASH JOIN连接中是用不到被驱动表上关联条件字段的索引的(不是过滤条件)

 

 达梦社区地址:https://eco.dameng.com 

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值