如题,聚合查询-释义:对于统计总数、平均数这类计算,SQL提供了专门的聚合函数,使用聚合函数进行查询,就是聚合查询,它可以快速获得结果。
- 常见聚合函数:
sum(列名) 求和
max(列名) 最大值
min(列名) 最小值
avg(列名) 平均值
first(列名) 第一条记录
last(列名) 最后一条记录
count(列名) 统计记录数 注意和count(*)的区别
使用聚合查询统计示例:
COUNT()表示查询所有列的行数(记录数),要注意聚合的计算结果虽然是一个数字,但查询的结果仍然是一个二维表,只是这个二维表只有一行一列,并且列名是COUNT()。
通常,使用聚合查询时,我们应该给列名设置一个别名,便于处理结果:
select count(*) as "统计" from teachers;
使用加入where条件的聚合查询:
COUNT(*)和COUNT(id)实际上是一样的效果。另外注意,聚合查询同样可以使用where条件关键字,但是不能和分组连用,因此我们可以方便地统计出有多少男生、多少女生、多少80分以上的学生等:
select count(*) as manteacher from students where gender ='男';
接下来介绍常和聚合函数并用的分组和条件关键字
分组: group by
- 谈到聚合查询必然会涉及group by
“Group By”从字面意义上理解就是根据“By”指定的规则对数据进行分组,所谓的分组就是将一个“数据集”划分成若干个“小区域”,然后针对若干个“小区域”进行数据处理。
select count(*) as manteacher from teachers group by age;
条件: having 和 where
-
where 子句的作用是在对查询结果进行分组前,将不符合where条件的行去掉,即在分组之前过滤数据,注意where条件中不能用包含聚合函数、使用where条件过滤出特定的行。
-
having 子句的作用是筛选满足条件的组,即在分组之后过滤数据,条件中经常包含聚组函数,使用having 条件过滤出特定的组,也可以使用多个分组标准进行分组。
-
过滤的顺序为:on->join->where->group by->having
-
解析:on是在join之前,很容易理解,join要根据on的条件生成键进行MR计算,where对于发生在join 之后,因此where里的过滤条件不会减少数据输入量,不过分区限制会。group by会对where过滤后的数据分组并进行聚合,having则对聚合后的结果再进行过滤。