我们公司上了一套系统,我查看了一下原开发人员在做报表时写的SQL代码,如下所示:
select
distinct
t3.code,t3.name,t3.material_spec,t3.default_unit,
sum(t2.quantity)
over
(
partition
by
t3.code)
sum_qty,
sum(t2.amount)
over
(
partition
by
t3.code)
sum_amount,
sum(t2.tax_amount)
over
(
partition
by
t3.code)
-
sum(t2.amount)
over
(
partition
by
t3.code)
tax,
sum(t2.tax_amount)
over
(
partition
by
t3.code)
total_amount
from
t1,t2,t3,t4
where
...
order
by
t3.code
然后以下是我自己整理的代码:
select
t3.code,t3.name,t3.material_spec,t3.default_unit,
sum(t2.quantity)
sum_qty,
sum(t2.amount)
sum_amount,
sum(t2.tax_amount)
-
sum(t2.amount)
tax,
sum(t2.tax_amount)
total_amount
from
t1,t2,t3,t4
where
...
group
by
t3.code,t3.name,t3.material_spec,t3.default_unit
order
by
t3.code
二者运行的结果一要,性能我的那个要比原开发人员写的来的快。而且相差的性能很明显。用group
by要快很多。我就想问一下这里的高人?用
partition
by是不是有别的用意?会比group
by
来的更科学更好?(ps:自己查资料一直找不到答案,所以上这里来麻烦大家了)
问题点数:100、回复次数:5
Top
sum() over (PARTITION BY ...) 是一个分析函数。 他执行的效果跟普通的sum ...group by ...不一样,它计算组中表达式的累积和,而不是简单的和。 表a,内容如下: B C D 02 02 1 02 03 2 02 04 3 02 05 4 02 01 5 02 06 6 02 07 7 02 03 5 02 02 12 02 01 2 02 01 23 select b,c,sum(d) e from a group by b,c 得到: B C E 02 01 30 02 02 13 02 03 7 02 04 3 02 05 4 02 06 6 02 07 7 而使用分析函数得到的结果是: SELECT b, c, d, SUM(d) OVER(PARTITION BY b,c ORDER BY d) e FROM a B C E 02 01 2 02 01 7 02 01 30 02 02 1 02 02 13 02 03 2 02 03 7 02 04 3 02 05 4 02 06 6 02 07 7 结果不一样,这样看还不是很清楚,我们把d的内容也显示出来就更清楚了: SELECT b, c, d,SUM(d) OVER(PARTITION BY b,c ORDER BY d) e FROM a B C D E 02 01 2 2 d=2,sum(d)=2 02 01 5 7 d=5,sum(d)=7 02 01 23 30 d=23,sum(d)=30 02 02 1 1 c值不同,重新累计 02 02 12 13 02 03 2 2 02 03 5 7 02 04 3 3 02 05 4 4 02 06 6 6 02 07 7 7