今天一位同事遇到个情况,查询一个Oracle视图发现执行时间很长,将近有十多分钟。
远程到同事机器上查看情况,一边开着执行计划跑下视图,同时看看视图详细信息,大致写法如下:
create or replace view v_sk as
select col1, col2, col3 from v_sk_old
union
select col1, col2, col3 from v_sk_new
待执行计划完成后,发现 unique 的开销巨大;因此立刻count了一下 v_sk_old 和 v_sk_new 两个视图的数据,发现一个有80多万条数据,另外一个有90多万条数据。那么问题原因就找到了。
使用 union 连接两个表会有两个操作 排序(sort) 和去重复(unique) ,都是两个相当占用开销的操作。平时如果连接的表数据量不大的情况,不会有什么感知,但是当数据的数量级上升后,会明显感觉花费的时间越来越长。通过执行计划能够很直观的看到开销变大。
与之类似的union all 则不会对数据做sort 和 unique 操作。
同事这边,我先通过intersect 连接两个表查询是否有重复数据(结果显示没有重复数据),并通过同事了解到,v_sk_old 和 v_sk_new 两个视图的数据虽然是同一类型的业务,但是数据来源是两套设备分别采集到的数据,不存在交叉重复,因此,将将union 修改为 union all 。
查询大概几秒钟就出结果,问题解决。