先说结论
- 语义相同,都走索引情况下,两者效率差不多,distinct 可以看作是特殊的 group by
- 语义相同,不走索引情况下,distinct 会更快一些,原因是 group by 可能会触发 filesort 进行排序
测试
DISTINCT
GROUP BY
隐式排序
MySQL :: MySQL 5.7 Reference Manual :: 8.2.1.14 ORDER BY Optimization
在 MySQL 8.0 之前,GROUP BY 会默认根据作用字段进行排序。在能利用索引时不需要排序(因为索引已经排过序了)当无法利用索引时,MySQL 会使用临时表再排序的方式实现 GROUP BY,且当结果集超过系统设置的临时表大小时,MySQL 就会先 copy 到磁盘上再进行操作,这样效率就会非常低,这也是为什么 8.0 以后弃用了隐式排序
禁止隐式排序
总结
更推荐使用 GROUP BY,语义更清晰,还可以使用 HAVING 进行过滤处理