MySQL中,distinct 和 group by 哪个效率更高?

在MySQL中,groupby和distinct在语义相同且有索引的情况下效率相当,因为两者都基于分组操作。但在无索引时,distinct通常比groupby更高效,因为groupby可能进行排序(filesort),影响性能。从MySQL8.0开始,隐式排序已被移除,使得两者在无索引时效率接近。groupby的优势在于其语义清晰且能进行更复杂的处理,如配合聚合函数和having子句。
摘要由CSDN通过智能技术生成

先说大致的结论:

  • 在语义相同,有索引的情况下:group bydistinct都能使用索引,效率相同。

  • 在语义相同,无索引的情况下:distinct效率高于group by。原因是distinctgroup by都会进行分组操作,但group by可能会进行排序,触发filesort,导致sql执行效率低下。

基于这个结论,你可能会问:

  • 为什么在语义相同,有索引的情况下,group bydistinct效率相同?

  • 在什么情况下,group by会进行排序操作?

带着这两个问题找答案,接下来我们先来看一下distinctgroup by的基础使用。

distinct的使用

distinct用法

SELECT DISTINCT columns FROM table_name WHERE where_conditions;

例如:

mysql> select distinct age from student;
+------+
| age  |
+------+
|   10 |
|   12 |
|   11 |
| NULL |
+------+
4 rows in set (0.01 sec)

distinct 关键词用于返回唯一不同的值。放在查询语句中的第一个字段前使用,且作用于主句所有列。

如果列具有NULL值,并且对该列使用distinct子句,MySQL将保留一个NULL值,并删除其它的NULL值,因为distinct子句将所有NULL值视为相同的值。

distinct多列去重

distinct多列的去重,则是根据指定的去重的列信息来进行,即只有所有指定的列信息都相同,才会被认为是重复的信息。

SELECT DISTINCT column1,column2 FROM table_name WHERE where_conditions;
mysql> select distinct sex,age from student;
+--------+------+
| sex    | age  |
+--------+------+
| male   |   10 |
| female |   12 |
| male   |   11 |
| male   | NULL |
| female |   11 |
+--------+------+
5 rows in set (0.02 sec)

group by的使用

对于基础去重来说,group by的使用和distinct类似。

单列去重

语法:

SELECT columns FROM table_name WHERE where_conditions GROUP BY columns;

执行:<

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值