更新:在
SQLfiddle中测试了所有5个查询,其中包含100K行(以及2个单独的案例,一个具有少量(25个)不同的值,另一个具有许多(大约25K值).
一个非常简单的查询是使用UNION DISTINCT.我认为如果四个列中的每个列都有一个单独的索引,那将是最有效的.如果Postgres已经实现了Loose Index Scan优化,那么四个列中的每一列都有一个单独的索引是有效的.所以这个查询效率不高,因为它需要对表进行4次扫描(并且不使用索引):
-- Query 1. (334 ms,368ms)
SELECT a AS abcd FROM tablename
UNION -- means UNION DISTINCT
SELECT b FROM tablename
UNION
SELECT c FROM tablename
UNION
SELECT d FROM tablename ;
另一个是第一个UNION ALL,然后使用DISTINCT.这还需要4次表扫描(并且不使用索引).当值很少时效率不差,并且在我的(非广泛的)测试中,更多的值变得最快:
-- Query 2. (87 ms,117 ms)
SELECT DISTINCT a AS abcd
FROM
( SELECT a FROM tablename
UNION ALL
SELECT b FROM tablename
UNION ALL
SELECT c FROM tablename
UNION ALL
SELECT d FROM tablename
) AS x ;
其他答案提供了使用数组函数或LATERAL语法的更多选项. Jack的查询(187毫秒,261毫秒)具有合理