现在有一张表,其内容如下:
id | code
----+--------
1 | aaabbb
2 | aaaccc
3 | aaabbb
(3 rows)
现用两种方式,以 code 为依据,找出其中的所有非重复数据。
方式一:使用 DISTINCT
postgres=# SELECT DISTINCT code FROM test;
code
--------
aaaccc
aaabbb
(2 rows)
方式二:使用 GROUP BY
postgres=# SELECT code FROM test GROUP BY code;
code
--------
aaaccc
aaabbb
(2 rows)
在这里,GROUP BY 的使用只为分组,不为其他任何事。
到底应该使用哪一个呢?
自己刚开始的时候是有些懵的,因为实现的内容太像了,从结果看,使用哪一个都符合内容,但是除了语法外,还有一条简单的规则:所写的东西需要简单易懂。例如,看到方式一的代码,首先想到的就是,这是去除重复数据的;看到方式二,就想到这是分组的。所以,具体使用哪个,根据最简单的事理逻辑来写。
除了语法的可行性、复杂性、可阅读性外,又收获了一条重要的写代码的原则:事理逻辑。一般不会在这方面出错,因为往往事理逻辑和代码逻辑的出发点是一致的(就自己的知识范围而言),不过像 SQL 这种用于使用而非编程的语言,事理逻辑不同而结果相同的情况可能会很多。
是为记,己莫忘。