一、数据
1.student.txt
学生表
Sid:学号
Sname:学生姓名
Sbirth:学生生日
Ssex:学生性别
01 赵雷 1990-01-01 男
02 钱电 1990-12-21 男
03 孙风 1990-05-20 男
04 李云 1990-08-06 男
05 周梅 1991-12-01 女
06 吴兰 1992-03-01 女
07 郑竹 1989-07-01 女
08 王菊 1990-01-20 女
2.course.txt
课程表
Cid:课程编号
Cname:课程名称
Tid:教师编号
01 语文 02
02 数学 01
03 英语 03
3.sc.txt
成绩表
Sid:学号
Cid:课程编号
score:成绩
01 01 80
01 02 90
01 03 99
02 01 70
02 02 60
02 03 80
03 01 80
03 02 80
03 03 80
04 01 50
04 02 30
04 03 20
05 01 76
05 02 87
06 01 31
06 03 34
07 02 89
07 03 98
4.teacher.txt
教师表
Tid:教师编号:
Tname:教师名字
01 张三
02 李四
03 王五
二、需求
– 1、查询"01"课程比"02"课程成绩高的学生的信息及课程分数:
– 2、查询"01"课程比"02"课程成绩低的学生的信息及课程分数:
– 3、查询平均成绩大于等于60分的同学的学生编号和学生姓名和平均成绩:
– 4、查询平均成绩小于60分的同学的学生编号和学生姓名和平均成绩: – (包括有成绩的和无成绩的)
– 5、查询所有同学的学生编号、学生姓名、选课总数、所有课程的总成绩:
– 6、查询"李"姓老师的数量:
– 7、查询学过"张三"老师授课的同学的信息:
– 8、查询没学过"张三"老师授课的同学的信息:
– 9、查询学过编号为"01"并且也学过编号为"02"的课程的同学的信息:
– 10、查询学过编号为"01"但是没有学过编号为"02"的课程的同学的信息:
– 11、查询没有学全所有课程的同学的信息:
–先查询出课程的总数量
–再查询所需结果
– 12、查询至少有一门课与学号为"01"的同学所学相同的同学的信息:
– 13、查询和"01"号的同学学习的课程完全相同的其他同学的信息: –备注:hive不支持group_concat方法,可用 concat_ws(’|’, collect_set(str)) 实现
– 14、查询没学过"张三"老师讲授的任一门课程的学生姓名:
– 15、查询两门及其以上不及格课程的同学的学号,姓名及其平均成绩:
– 16、检索"01"课程分数小于60,按分数降序排列的学生信息:
– 17、按平均成绩从高到低显示所有学生的所有课程的成绩以及平均成绩:
– 18.查询各科成绩最高分、最低分和平均分:以如下形式显示:课程ID,课程name,最高分,最低分,平均分,及格率,中等率,优良率,优秀率: –及格为>=60,中等为:70-80,优良为:80-90,优秀为:>=90
– 19、按各科成绩进行排序,并显示排名: – row_number() over()分组排序功能(mysql没有该方法)
– 20、查询学生的总成绩并进行排名:
– 21、查询不同老师所教不同课程平均分从高到低显示: – 方法1
– 22、查询所有课程的成绩第2名到第3名的学生信息及该课程成绩:
– 23、统计各科成绩各分数段人数:课程编号,课程名称,[100-85],[85-70],[70-60],[0-60]及所占百分比
– 24、查询学生平均成绩及其名次:
– 25、查询各科成绩前三名的记录
–课程id为01的前三名
–课程id为02的前三名
–课程id为03的前三名
– 26、查询每门课程被选修的学生数:
– 27、查询出只有两门课程的全部学生的学号和姓名:
– 28、查询男生、女生人数:
– 29、查询名字中含有"风"字的学生信息:
– 30、查询同名同性学生名单,并统计同名人数:
– 31、查询1990年出生的学生名单:
– 32、查询每门课程的平均成绩,结果按平均成绩降序排列,平均成绩相同时,按课程编号升序排列:
– 33、查询平均成绩大于等于85的所有学生的学号、姓名和平均成绩:
– 34、查询课程名称为"数学",且分数低于60的学生姓名和分数:
– 35、查询所有学生的课程及分数情况:
– 36、查询任何一门课程成绩在70分以上的学生姓名、课程名称和分数:
– 37、查询课程不及格的学生:
– 38、查询课程编号为01且课程成绩在80分以上的学生的学号和姓名:
– 39、求每门课程的学生人数:
– 40、查询选修"张三"老师所授课程的学生中,成绩最高的学生信息及其成绩:
– 41、查询不同课程成绩相同的学生的学生编号、课程编号、学生成绩:
– 42、查询每门课程成绩最好的前三名:
– 43、统计每门课程的学生选修人数(超过5人的课程才统计): – 要求输出课程号和选修人数,查询结果按人数降序排列,若人数相同,按课程号升序排列
– 44、检索至少选修两门课程的学生学号:
– 45、查询选修了全部课程的学生信息:
– 46、查询各学生的年龄(周岁): – 按照出生日期来算,当前月日 < 出生年月的月日则,年龄减一 方法一
– 47、查询本周过生日的学生: –方法1
– 48、查询下周过生日的学生: –方法1
– 49、查询本月过生日的学生: –方法1
– 50、查询12月份过生日的学生:
三、实现
1.建表导入数据
--学生表
create table t_student(
sid string,
sname string,
sbir date,
ssex string
)row format delimited
fields terminated by ' '
collection items terminated by '-'
load data local inpath '/opt/data/student.txt' into table t_student
select * from t_student
--课程表
create table t_course(
cid int,
cname string,
tid int
)row format delimited
fields terminated by ' '
load data local inpath '/opt/data/course.txt' into table t_course
select * from t_course
--分数表
create table t_sc(
sid int,
cid int,
score double
)row format delimited
fields terminated by ' '
drop table sc
load data local inpath '/opt/data/sc.txt' into table t_sc
select * from t_sc
--教师表
create table t_teacher(
tid int,
tname string
)row format delimited
fields terminated by ' '
load data local inpath '/opt/data/teacher.txt' into table t_teacher
select * from t_teacher
2.实现
--查询
select * from t_student
select * from t_course
select * from t_sc
select * from t_teacher
-- 1、查询"01"课程比"02"课程成绩高的学生的信息及课程分数:
select t3.*,t1.score as score1,t2.score as score2
from (select * from t_sc where cid='1') t1 join (select * from t_sc where cid='2') t2 on t1.sid=t2.sid
left join t_student t3 on t1.sid=t3.sid
where t1.score>t2.score
-- 2、查询"01"课程比"02"课程成绩低的学生的信息及课程分数:
select t3.*,t1.score as score1,t2.score as score2
from (select * from t_sc where cid='1') t1 join (select * from t_sc where cid='2') t2 on t1.sid=t2.sid
left join t_student t3 on t1.sid=t3.sid
where t1.score<t2.score
-- 3、查询平均成绩大于等于60分的同学的学生编号和学生姓名和平均成绩:
select t2.sname ,AVG(score) as a
from t_sc t1 left join t_student t2 on t1.sid =t2.sid
group by t2.sname
having a>=60
-- 4、查询平均成绩小于60分的同学的学生编号和学生姓名和平均成绩: – (包括有成绩的和无成绩的)
select t2.sname ,AVG(score) as a
from t_sc t1 left join t_student t2 on t1.sid =t2.sid
group by t2.sname
having a<60
--5,查询所有同学的学生编号、学生姓名、选课总数、所有课程的总成绩:
select t1.sid,t1.sname,count(cid),sum(score)
from t_student t1 left join t_sc t2 on t1.sid =t2.sid
group by t1.sid,t1.sname
-- 6、查询"李"姓老师的数量:
select count(tid)
from t_teacher
where tname LIKE '李%'
--7、查询学过"张三"老师授课的同学的信息:
select t5.*
from t_sc t1 join t_course t2 on t1.cid =t2.cid join t_teacher t3
on t2.tid=t3.tid join t_student t5 on t5.sid =t1.sid
where t3.tname ='张三'
--8.查询没学过"张三"老师授课的同学的信息:
select t1.*
from t_student t1 left join (
select sid from t_sc t2 join t_course t3 on t2.cid =t3.cid
join t_teacher t4 on t3.tid =t4.tid and t4.tname ='张三') t5 on t1.sid =t5.sid
where t5.sid is null
-- 9、查询学过编号为"01"并且也学过编号为"02"的课程的同学的信息:
select t1.*
from t_student t1 join (select * from t_sc where cid='1') t2 on t1.sid=t2.sid
join (select * from t_sc where cid='2') t3 on t1.sid =t3.sid
-- 10、查询学过编号为"01"但是没有学过编号为"02"的课程的同学的信息:
select *
from t_student t1 left join (select * from t_sc where cid='1') t2 on t1.sid=t2.sid
left join (select * from t_sc where cid='2') t3 on t1.sid =t3.sid
where t3.score is null and t2.score is not null