在数据库中,UNION和UNION ALL关键字都是将两个结果集合并为一个,但这两者从使用和效率上来说都有所不同。
UNION在进行表链接后会筛选掉重复的记录,所以在表链接后会对所产生的结果集进行排序运算,删除重复的记录再返回结果。
实际大部分应用中是不会产生重复的记录,最常见的是过程表与历史表UNION。如:
select * from table1
union
select * from table2
这个SQL在运行时先取出两个表的结果,再用排序空间进行排序删除重复的记录,最后返回结果集,如果表数据量大的话可能会导致用磁盘进行排序。
而UNION ALL只是简单的将两个结果合并后就返回。这样,如果返回的两个结果集中有重复的数据,那么返回的结果集就会包含重复的数据了。
从效率上说,UNION ALL 要比UNION快很多,所以,如果可以确认合并的两个结果集中不包含重复的数据的话,那么就使用UNION ALL,如下:
select * from table1
union all
select * from table2
=======================================================
create table #T (编码 varchar(3),销售数量 int,零售价 money,销售日期 datetime)
insert into #T
select '001',5,6,'2008-01-01' union all
select '002',2,12,'2008-01-01' union all
select '001',3,6,'2008-01-02' union all
select '002',8,12,'2008-01-02' union all
select '001',2,6.5,'2008-01-03' union all
select '003',10,12.5,'2008-01-03'
go
select case when 销售日期 < '2008-01-02' then '此前销售' else 编码 end as 编码,
sum(销售数量) as 销售数量,
sum(销售数量*零售价) as 销售金额
from #t
where 销售日期 <= '2008-01-03'
group by case when 销售日期 < '2008-01-02' then '此前销售' else 编码 end
if object_id('tempdb.dbo.#T') is not null drop table #T
select * from #T