数据分组
分组允许把数据分成多个逻辑组,以便能对每个分组进行聚集计算
创建分组
- 分组是在select语句的group by子句中建立的
- select vend_id,count(*) as num_prods from products group by vend_id;
- group by 子句指示MySQL按vend_id排序并分组数据,这对每个vend_id而不是整个表计算num_prods一次
- group by子句可以包含任意数目的列
- 如果在group by子句中嵌套了分组,数据将在最后规定的分组上进行汇总
- group by子句中列出的每个列都必须是检索列或有效的表达式(但不能是聚集函数)
- 除聚集计算语句外,select语句中的每个列都必须在group by子句中给出
- 如果分组列中具有NULL值,则NULL将作为一个分组返回
- group by子句必须出现在where子句之后 order by子句之前
- 使用with rollup关键字,可以得到每个分组以及每个分组汇总级别(针对每个分组)的值group by vend_id with rollup
过滤分组
- where过滤行,having过滤分组,having支持所有where操作符
- select cust_id,count(*) as orders from.orders group by cust_id having count(*) >= 2;
- where与having的差别,where在数据分组前进行过滤,having在数据分组后进行过滤
分组和排序
- order by排序产生的输出,group by分组行 但输出可能不是分组的排序
- order by任意列都可以使用(甚至非选择的列也可以使用),group by只可能使用选择的列或表达式列,而且必须使用每个选择列表达式
- order by不一定需要,group by如果与聚集函数一起使用列(或表达式),则必须使用
- select order_num,sum(quantity*item_price) as ordertotal from orderitems group by order_num having sum(quantity*item_price) >= 50 order by ordertotal;
- group by子句用来按订单号(order_num列)分组数据,以便sum(*)函数能够返回总计订单价格。having子句过滤数据,使得只返回总计订单价格大于等于50的订单,最后,用order by子句排序输出