MySQL 中的 distinct 和 group by 比较
结论
先说大致的结论
-
在语义相同,有索引的情况下group by和distinct都能使用索引,效率相同。distinct可以被看做是特殊的group by。
-
在语义相同,无索引的情况下:distinct效率高于group by。原因是distinct 和 group by都会进行分组操作,但group by可能会进行隐式排序,触发filesort,导致sql执行效率低下。从Mysql8.0开始执行的效率都差不多是一样的。
区别
两者的语法区别在于,group by可以进行单列去重,group by的原理是先对结果进行分组排序,然后返回每组中的第一条数据。且是根据group by的后接字段进行去重的。
推荐使用group by :
- 好理解、方便处理数据、更加灵活、可结合having进行数据过滤。
distinct的使用
关键词用于返回唯一不同的值。放在查询语句中的第一个字段前使用,且作用于主句所有列
select distinct age from student;
+------+
| age |
+------+
| 10 |
| 12 |
| 11 |
| NULL |
+------+
select distinct sex,age from student;
+--------+------+
| sex | age |
+--------+------+
| male | 10 |
| female | 12 |
| male | 11 |
| male | NULL |
| female | 11 |
+--------+------+
group by的使用
select age from student group by age;
+------+
| age |
+------+
| 10 |
| 12 |
| 11 |
| NULL |
+------+
select sex,age from student group by sex,age;
+--------+------+
| sex | age |
+--------+------+
| male | 10 |
| female | 12 |
| male | 11 |
| male | NULL |
| female | 11 |
+--------+------+
select sex,age from student group by sex;
+--------+-----+
| sex | age |
+--------+-----+
| male | 10 |
| female | 12 |
+--------+-----+
隐式排序(8.0之后就移除了)
GROUP BY 默认隐式排序(指在 GROUP BY 列没有 ASC 或 DESC 指示符的情况下也会进行排序)。然而,GROUP BY进行显式或隐式排序已经过时(deprecated)了,要生成给定的排序顺序,请提供 ORDER BY 子句.