原文地址:http://www.cnblogs.com/rainman/archive/2013/05/01/3053703.html
一、概述
“Group By”从字面意义上理解就是根据“By”指定的规则对数据进行分组,所谓的分组就是将一个“数据集”划分成若干个“小区域”,然后针对若干个“小区域”进行数据处理。
二、原始表
三、简单的Group By
select 类别, sum(数量) as 数量之和 from A group by 类别返回结果如下表,实际上就是分类汇总。
四、Group By 和 Order By
select 类别, sum(数量) AS 数量之和 from A group by 类别 order by sum(数量) desc
五、Select字段的限制
select 类别, sum(数量) as 数量之和, 摘要 from A group by 类别 order by 类别 desc
结果:
很显然,Group By后已经失去了‘摘要’这个属性列,因此在select指定的字段要么就要包含在Group By语句的后面,作为分组的依据;要么就要被包含在聚合函数中。
六、Group By All
select 类别, 摘要, sum(数量) as 数量之和 from A group by all 类别, 摘要示例中则可以指定“摘要”字段,其原因在于“多列分组”中包含了“摘要字段”,其执行结果如下表
注意到与原数据对比,红框框圈出的地方实际上将原数据的第二条和最后一条通过聚集函数合并!“多列分组”实际上就是就是按照多列(类别+摘要)合并后的值进行分组
SQL Server中虽然支持“group by all”,但Microsoft SQL Server 的未来版本中将删除 GROUP BY ALL,避免在新的开发工作中使用 GROUP BY ALL。Access中是不支持“Group By All”的,但Access中同样支持多列分组,上述SQL Server中的SQL在Access可以写成
select 类别, 摘要, sum(数量) AS 数量之和 from A group by 类别, 摘要
七、Group By与聚合函数
在第五节中提到group by语句中select指定的字段必须是“分组依据字段”,其他字段若想出现在select中则必须包含在聚合函数中,常见的聚合函数如下表:
函数 | 作用 | 支持性 |
---|---|---|
sum(列名) | 求和 | |
max(列名) | 最大值 | |
min(列名) | 最小值 | |
avg(列名) | 平均值 | |
first(列名) | 第一条记录 | 仅Access支持 |
last(列名) | 最后一条记录 | 仅Access支持 |
count(列名) | 统计记录数 | 注意和count(*)的区别求各组平均值 |
示例1:求各组平均值
select 类别, avg(数量) AS 平均值 from A group by 类别;
示例2:求各组记录数目
select 类别, count(*) AS 记录数 from A group by 类别;
八、Having和Where的区别
- where 子句的作用是在对查询结果进行分组前,将不符合where条件的行去掉,即在分组之前过滤数据,where条件中不能包含聚组函数,使用where条件过滤出特定的行。
- having 子句的作用是筛选满足条件的组,即在分组之后过滤数据,条件中经常包含聚组函数,使用having 条件过滤出特定的组,也可以使用多个分组标准进行分组。
示例1
select 类别, sum(数量) as 数量之和 from A group by 类别 having sum(数量) > 18