如何在mysql中查询每个分组的前几名

最新推荐文章于 2023-09-07 16:21:40 发布

Java部落格

最新推荐文章于 2023-09-07 16:21:40 发布

阅读量413

点赞数

分类专栏： mysql 文章标签： mysql

mysql 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

#问题# 在工作中常会遇到将数据分组排序的问题，如在考试成绩中，找出每个班级的前五名等。在orcale等数据库中可以使用partition 语句来解决，但在mysql中就比较麻烦了。这次翻译的文章就是专门解决这个问题的

在使用SQL的过程中，我们经常遇到这样一类问题：如何找出每个程序最近的日志条目？如何找出每个用户的最高分？在每个分类中最受欢迎的商品是什么?通常这类“找出每个分组中最高分的条目”的问题可以使用相同的技术来解决。在这篇文章里我将介绍如何解决这类问题，而且会介绍如何找出最高的前几名而不仅仅是第一名。

这篇文章会用到行数(row number)，我在原来的文章 MySQL-specific 和 generic techniques 中已经提到过如何为每个分组设置行数了。在这里我会使用与原来的文章中相同的表格，但会加入新的price 字段

其中一个常用的方法是使用自连接(self-join)，第一步根据type(apple, cherry etc)进行分组，并找出每组中price的最小值

select f.type, f.variety, f.price
from (
select type, min(price) as minprice
from fruits group by type
) as x inner join fruits as f on f.type = x.type and f.price = x.minprice;

##找出每组中前N个值## 这个问题会稍微复杂一些。我们可以使用聚集函数(MIN(), MAX()等等)来找一行，但是找前几行不能直接使用这些函数，因为它们都只返回一个值。但这个问题还是可以解决的。

这次我们找出每个类型(type)中最便宜的前两种水果，首先我们尝试

我们有一种稍好的方式，在每个种类中选择不超过该种类第二便宜的水果（也就是每个种类中有2个苹果的价格低于这个苹果，那么这个苹果就不是最便宜的前两个！）

select type, variety, price
from fruits
where (
select count(*) from fruits as f
where f.type = fruits.type and f.price <= fruits.price
) <= 2;

注意：相关子查询的执行依赖于外部查询。多数情况下是子查询的WHERE子句中引用了外部查询的表，外部查询执行一行，子查询就执行一次
执行过程：
（1）从外层查询中取出一个元组，将元组相关列的值传给内层查询。
（元组的概念：元组是关系数据库中的基本概念，关系是一张表，表中的每行（即数据库中的每条记录）就是一个元组，每列就是一个属性。在二维表里，元组也称为记录
（2）执行内层查询，得到子查询操作的值。
（3）外查询根据子查询返回的结果或结果集得到满足条件的行。
（4）然后外层查询取出下一个元组重复做步骤1-3，直到外层的元组全部处理完毕

这次的代码要优雅很多，而且在N增加时不需要重新代码(非常棒！)。但是这个查询在功能上和原来的是一样。他们的时间复杂度均为分组中条目数的二次方。而且，很多优化器都不能优化这种查询，使得它的耗时最好为全表行数的二次方(尤其在没有设置正确的索引时)，而且数据量大时，可能将服务器会停止响应。那么还有更好的方法吗？有没有办法可以仅仅扫描一次数据，而不是通过子查询进行多次扫描。(译者注：这种方法有一个问题，就是如果排名并列第一的数字超过N后，这个分组会选不出数据，比如price为2.79的apple有3个，那么结果中就没有apple了)

##使用 UNION## 如果已经为type, price设置了索引，而且在每个分组中去除的数据要多于包含的数据，一种非常高效的单次扫描的方法是将查询拆分成多个独立的查询(尤其对mysql，对其他的RDBMSs也有效)，再使用UNION将结果拼到一起。mysql的写法如下：

(select * from fruits where type = ‘apple’ order by price limit 2)
union all
(select * from fruits where type = ‘orange’ order by price limit 2)
union all
(select * from fruits where type = ‘pear’ order by price limit 2)
union all
(select * from fruits where type = ‘cherry’ order by price limit 2)
Peter Zaistev写了相关的文章, 我在这里就不赘述了。如果这个方案满足你的要求，那它就是一个非常好的选择.

注意：这里要使用UNION ALL，而不是UNION。后者会在合并的时候会将重复的条目清除掉。在我们的这个示例中没有去除重复的需求,所以我们告诉服务器不要清除重复,清除重复在这个问题中是无用的，而且会造成性能的大幅下降。

参考链接：
https://my.oschina.net/u/1032146/blog/149300
https://blog.csdn.net/qq_39930129/article/details/80112884
https://blog.csdn.net/varyall/article/details/82561701

Java部落格

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
如何在mysql中查询每个分组的前几名

#问题# 在工作中常会遇到将数据分组排序的问题，如在考试成绩中，找出每个班级的前五名等。在orcale等数据库中可以使用partition 语句来解决，但在mysql中就比较麻烦了。这次翻译的文章就是专门解决这个问题的在使用SQL的过程中，我们经常遇到这样一类问题：如何找出每个程序最近的日志条目？如何找出每个用户的最高分？在每个分类中最受欢迎的商品是什么?通常这类“找出每个分组中最高分的条目”...
复制链接

扫一扫