目录
1、目的
- DISTINCT主要用于返回唯一不同的值
- GROUP BY主要用于根据一个或多个列对数据进行分组,并对每个组应用聚合函数
2、功能
- DISTINCT仅用于返回唯一不同的值,它不提供聚合函数的功能
- GROUP BY可以与聚合函数一起使用,例如SUM、AVG、COUNT等,以对每个组执行计算
3、语法
- DISTINCT关键字通常用于SELECT语句中,以从结果集中删除重复的行
- GROUP BY关键字通常与聚合函数一起使用,并且需要指定一个或多个列,以便将数据分组
4、返回结果
- 使用DISTINCT时,返回的结果集只包含唯一不同的值
- 使用GROUP BY时,返回的结果集包含分组后的聚合结果
5、应用场景
在“aaa”数据库中有一个学生表,表的字段和数据如下图所示:
- 获取学生中的不同名字(相当于种类名称)
-- distinct和group by的简单语法
select distinct(name) from aaa.student;
select name from aaa.student group by name;
两条语句执行的结果一样:
- 获取学生中不同名字的名字个数(相当于种类个数)
-- 和count的搭配使用
select count(distinct name) from aaa.student;
select count(name) from aaa.student group by name;
但是,这两个语句的执行结果却有所区别,第一个语句返回了所有种类的总个数,而第二个语句返回了每个种类的个数:
那么怎么用group by查询到种类个数呢?group by下面的用法可以返回种类个数:
select count(*) from (select name from aaa.student group by name ) as kk; #注意这里一定要给select子查询生成的派生表取别名(用as关键字),不然语句执行报错
另外,下面group by的用法可以查询到到不同的名字及拥有该名字的学生数(种类名称及其对应个体数目):
select name,count(name) from aaa.student group by name;
其运行结果如下:
- 获取名字或性别不同的学生信息(相当于多字段分组)
上面两个场景实质上都属于单字段分组,那怎么进行多字段分组呢?下面两个等价的sql语句会给出答案。
-- 多字段组合过滤--
select count(distinct name,sex) from aaa.student;
select count(*) from (select name,sex from aaa.student group by name,sex) as kk; #as:派生表取别名
其运行结果为:
另外,为了帮助理解和加深印象,下面两个sql语句:
运行结果分别为 :