mysql查询各科成绩前三名的记录,sql查询各科成绩前三名----详述过程,思路清晰不烧脑...

使用mysql、hive查询各科成绩前三名

一、建表造数据

建表:

create table scores(

name varchar(100),

subject varchar(100),

score int

);

插入数据:

insert into scores values

('学生a','java','100'),

('学生b','java','90'),

('学生c','java','90'),

('学生d','java','60'),

('学生e','java','80'),

('学生a','python','100'),

('学生b','python','90'),

('学生c','python','90'),

('学生d','python','60'),

('学生e','python','80');

二、使用myql查询

2.1 不考虑并列情况

方法一:使用加行号的方式查询

加行号的使用规则是:@rowNum:=num

意思是声明一个叫 rowNum 的变量并赋值为num

示例: 现在有一个需求是: “查询学生 java 课的成绩、姓名并排名?”

select score,name,@m1:=@m1+1 r from scores,(select @m1:=0)a where subject='java' order by score desc

查询结果如下

a322ad56634b10d4a0be2dab31a295c3.png

此处加行号m1的作用就可以体现出来,查询语句中多了一个字段 r ,他可以以数字1,2,3,4,5的形式显示排名

由此引申,此条查询语句结尾在加上 limit 3 便可以取出前三名

select score,name,@m1:=@m1+1 r from scores,(select @m1:=0)a where subject='java' order by score desc limit 3

再引申,若要查询所有课程的成绩,取前三名,则就需要将其他的课程表 join 在一起,关联条件为每条查询语句的行号相等

select s1.score "java成绩",s1.name,s2.score "python成绩",s2.name,s1.r "排名" from

(select score,name,@m1:=@m1+1 r from scores,(select @m1:=0)a where subject='java' order by score desc limit 3)s1

join

(select score,name,@m2:=@m2+1 r from scores,(select @m2:=0)b where subject='python' order by score desc limit 3)s2

on s1.r=s2.r;

输出结果为:

a21829dd853e413f0391ec15e64fe90e.png

这种方法查询实际上是 列转行 的方式,将字段subject 列 转成 行 输出。

优点 是容易理解,增加了一个字段显示排名,更加直观。

缺点 是在关联条件多(比如课程数量大于10,查询每科前10名,前20名成绩…)的情况下, join 关联10次以上,频繁的join会损耗系统很多性能,严重的会直接堵塞死。且有个弊端是写查询语句的时候必须要知道具体有几门课及课程名称,where 条件就已经限定了每门课的课程id或者课程名称,但有些情况下表数据量很大的时候,这种方法是不合适的。

方法二:使用子查询嵌套查询(使用最多)

select s1.* from scores s1

where (select count(1) from scores s2 where s1.subject=s2.subject and s1.score

order by s1.subject,s1.score desc;

查询结果如下:

a2e924c35990923b3398fc4a6814a0aa.png

这种方法比较难懂,但是查询速度快且代码简单,解析如下:

首先如果要查询所有课程的成绩,如下:

a13bb92f8108fef3f76f50674a2dd263.png

再对各科成绩倒序排列输出:

151d5eeb56db16ec24d626f72d0e151c.png

然后 取各科成绩前三名,就需要嵌套子查询进行筛选,代码如下:

select s1.* from scores s1

where (select count(1) from scores s2 where s1.subject=s2.subject and s1.score

order by s1.subject,s1.score desc;

查询语句重点在于 -->子查询语句: select count(1) from scores s2 where s1.subject=s2.subject and s1.score

意思是:统计学生个数,即关联两个分数表s1、s2,外层查询每查询一次,再到内层循环中查询表s2,当课程名相同时,统计 s1.score

这么说可能还是有点懵,现在我们来走一遍流程,从头到尾依次遍历一次,详细说明:

首先从学生a开始查询:

7082b35fca09dabbc5a8e885742ecb18.png

→学生b:

d711d384282c214ceef9b036c7db4bec.png

→学生c:

4c5d4041f9d5be92aaf26a80ffd2b0d9.png

→学生d:

0d71d698bd030eec5e7ca8b2f39e94e4.png

→学生e:

892694a0c3cd112bef04bd8bf674575c.png

此时从学生a到e的 “java” 课程前三名已经筛选完成,对于 “python” 课程,重复上述流程即可

全部筛选完毕最后再对查询出的课程、分数倒序排列即可 :order by s1.subject,s1.score desc

2.2 考虑并列情况

select s1.name,s1.subject,s1.score from scores s1

left join (select distinct subject,score from scores) s2

on s1.subject=s2.subject

and s1.score

group by s1.name,s1.subject,s1.score

having count(1)<3

order by subject,score desc;

查询结果如下:

2105dbd1457581f6f2d3c9e28cd6c335.png

很直观的可以看出,学生b和c成绩都为90分,并列第二名,学生e成绩80分,为第三名

查询语句解析:

这是在 2.1方法二 的基础上,使用 distinct 关键字对表s2中存在多名同学分数相同的情况进行 去重,从而达到并列排名的目的。需要注意的是,由于groub by 的条件是表s1中的字段,所以 count(1) 统计的是表s1中每次查询s1.score

三、使用hive查询前三名

使用hive查询需要调用 窗口函数,类似于 2.1方法一 中加行号查询,但使用不同的窗口函数可以实现并列与不并列的排名顺序

3.1 不考虑并列情况:rank()

select * from

(select name,subject,score,rank() over (partition by subject order by score desc) ranks from scores)s

where ranks<4;

查询结果如下:

510a31b356ac61481125a9caa04b8821.png

3.2 考虑并列情况:dense_rank()

select * from

(select name,subject,score,dense_rank() over (partition by subject order by score desc) ranks from scores)s

where ranks<4;

查询结果如下:

fe9cd3e8b7abcf9df5aabe98e73de496.png

  • 9
    点赞
  • 24
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值