MySQL之分组数据

1、group by创建分组

在MySQL中,分组是在select语句中的group by子句中建立的,比如:

SELECT vend-id, COUNT(*) as num_prods FROM products GROUP BY vend_id;

这条SQL语句指定了2个列,group by指示MySQL按照vend_id排序并且分组(如果使用group by,则不必指定要计算的每个组)

group by子句指示指示MySQL分组数据,然后都每个组而不是整个结果集进行聚集;关于group by使用,请注意以下规则:

group by子句可以包含任意数目的列(使得对分组进行嵌套,为数据分组提供更细致的控制);

如果在group by子句中嵌套分组,数据将在最后规定的分组上进行汇总,即:建立分组时,指定的所有列都一起计算(所以不能从个别列取回数据);

group by子句中列出的每个列都必须是检索列或有效的表达式(但不能是聚集函数),如果在select中使用表达式,则必须在group by子句中指定相同的表达式(不能使用别名)

除了聚集计算语句外,select中每个列都必须在group by子句中给出;

如果分组列中具有null值,则null将作为一个分组返回(如果列中有多行null值,他们将分为一组);

group by子句必须出现在where子句之后,order by子句之前;

PS:使用with rollup关键字,可以得到每个分组以及每个分组汇总级别(针对每个分组)的值。

可以对比着看是否使用rollup的两种情况:

mysql> select dep,pos,avg(sal) from employee group by dep,pos;  
+------+------+-----------+  
| dep | pos | avg(sal) |  
+------+------+-----------+  
| 01 | 01 | 1500.0000 |  
| 01 | 02 | 1950.0000 |  
| 02 | 01 | 1500.0000 |  
| 02 | 02 | 2450.0000 |  
| 03 | 01 | 2500.0000 |  
| 03 | 02 | 2550.0000 |  
+------+------+-----------+  
6 rows in set (0.02 sec)

自动剔除含有NULL值的行,没有显示NULL的行。

mysql> select dep,pos,avg(sal) from employee group by dep,pos with rollup;  
+------+------+-----------+  
| dep | pos | avg(sal) |  
+------+------+-----------+  
| 01 | 01 | 1500.0000 |  
| 01 | 02 | 1950.0000 |  
| 01 | NULL | 1725.0000 |  
| 02 | 01 | 1500.0000 |  
| 02 | 02 | 2450.0000 |  
| 02 | NULL | 2133.3333 |  
| 03 | 01 | 2500.0000 |  
| 03 | 02 | 2550.0000 |  
| 03 | NULL | 2533.3333 |  
| NULL | NULL | 2090.0000 |  
+------+------+-----------+  
10 rows in set (0.00 sec)  

将NULL的行也全部显示出来了。

需要注意的是,使用有 WITH ROLLUP 子句的 GROUP BY 语句时,不能再使用 ORDER BY 语句对结果集进行排序,如果对返回的结果顺序不满意,需要应用程序获得结果后在程序中进行排序。


2、having过滤分组

where子句都可以用having代替,区别在于where过滤行,having过滤分组;having支持所有的where操作符,比如:

select cust_id,count(*) as orders from orders group by cust_id having count(*) >= 2;

这条SQL语句中的having子句过滤count(*)>=2(2个以上的分组)的那些分组;

having和where的区别:

where在数据分组前进行过滤,having在数据分组后进行过滤;where排除的行不包括在分组中(这可能会改变计算值,从而影响having子句中基于这些值过滤掉的分组)

having和where可以同时使用,比如:

select vend_id, count(*) as num_prods from products where prod_price>=10 group by vend_id having count(*)>= 2;

这条SQL语句中,where子句过滤掉所有prod_price至少为10的行,然后按照vend_id分组数据;having子句过滤技术为2或2以上的分组;

再比如以age作为分组,计算相同age的行数,并输出行数>=0的age列:

 

3、分组和排序

group by和order by的区别:

order by的重要性:一般使用group by子句时,应该也给出order by子句,这是保证数据正确性的唯一方法(千万不要依赖group by排序数据)。


4、select子句顺序(从前往后)

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
MySQL中获取分组数据可以使用以下两种方法: 方法一:使用子查询和LIMIT子句 可以使用子查询和LIMIT子句来获取每个分组中的前几条数据。例如,以下是一个示例查询,它获取每个教师的前3名学生的数据: ``` SELECT t.*, s.* FROM teacher t JOIN ( SELECT * FROM student WHERE teacherId IN ( SELECT DISTINCT teacherId FROM student ) ORDER BY score DESC LIMIT 3 ) s ON t.id = s.teacherId; ``` 这个查询首先在子查询中获取每个教师的前3名学生的数据,然后将结果与教师表进行连接,以获取教师和学生的相关信息。 方法二:使用窗口函数和RANK()函数 如果你的MySQL版本支持窗口函数,你可以使用RANK()函数来获取每个分组中的排名数据。以下是一个示例查询,它获取每个教师的排名第一的学生的数据: ``` WITH st AS ( SELECT *, RANK() OVER (PARTITION BY teacherId ORDER BY score DESC) AS rank FROM student ) SELECT t.*, s.* FROM teacher t JOIN st s ON t.id = s.teacherId WHERE s.rank = 1; ``` 这个查询使用RANK()函数对每个教师的学生按照分数进行排名,然后将排名为1的学生与教师表进行连接,以获取教师和学生的相关信息。 请注意,以上两种方法都是基于你提供的引用内容\[1\]和\[2\]进行的解答。同时,如果你在使用方法二时遇到了报错,可能是因为你的MySQL版本较新,需要根据引用内容\[3\]中提到的only_full_group_by设置进行调整。 #### 引用[.reference_title] - *1* *2* *3* [mysql获取分组中的指定数据(附四大排序函数说明)](https://blog.csdn.net/worilb/article/details/116997971)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v91^insert_down28v1,239^v3^insert_chatgpt"}} ] [.reference_item] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

金州饿霸

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值