PostgreSQL 中除了 SPJ(SELECT、PROJECT、JOIN) 之外,还有大量的聚合和分组操作,比如下面示例中的语句,其中有聚集操作 avg(a) 和分组操作 GROUP BY b。顾名思义,聚集操作就是一个合并的过程,而分组操作则是对数据的归类。
postgres=# EXPLAIN SELECT avg(a) FROM TEST_A GROUP BY b;
QUERY PLAN
--------------------------------------------------------------
HashAggregate (cost=2.50..3.75 rows=100 width=36)
Group Key: b
-> Seq Scan on test_a (cost=0.00..2.00 rows=100 width=8)
(3 rows)
简单的聚集操作
简单来说,聚集操作分成 3 个步骤。
- 初始阶段:初始化一个初值,比如对于 avg 操作来说,它的初值是 0。
- 中间阶段:向初值中不断累加值,并记载累加了多少条记录。比如要对 TEST_A.a 做 avg 聚集操作,就需要先把 TEST_A.a 中的所有列值累加起来,并且同时统计 TEST_A.a 中有多少条数据。
- 结束阶段&#x