hive初级练习50题
- 一.建库和建表
- 二.练习50题(详细过程)
-
- 1.查询"01"课程比"02"课程成绩高的学生的信息及课程分数
- 2.查询"01"课程比"02"课程成绩低的学生的信息及课程分数
- 3.查询平均成绩大于等于60分的同学的学生编号和学生姓名和平均成绩
- 4.查询平均成绩小于60分的同学的学生编号和学生姓名和平均成绩 (包括有成绩的和无成绩的)
- 5.查询所有同学的学生编号、学生姓名、选课总数、所有课程的总成绩
- 6.查询"李"姓老师的数量
- 7.查询学过"张三"老师授课的同学的信息
- 8.查询没学过"张三"老师授课的同学的信息
- 9.查询学过编号为"01"并且也学过编号为"02"的课程的同学的信息
- 10.查询学过编号为"01"但是没有学过编号为"02"的课程的同学的信息
- 11.查询没有学全所有课程的同学的信息
- 12.查询至少有一门课与学号为"01"的同学所学相同的同学的信息
- 13.查询和"01"号的同学学习的课程完全相同的其他同学的信息
- 14.查询没学过"张三"老师讲授的任一门课程的学生姓名
- 15.查询两门及其以上不及格课程的同学的学号,姓名及其平均成绩
- 16.检索"01"课程分数小于60,按分数降序排列的学生信息
- 17.按平均成绩从高到低显示所有学生的所有课程的成绩以及平均成绩
- 18.查询各科成绩最高分、最低分和平均分:以如下形式显示:课程ID,课程name,最高分,最低分,平均分,及格率,中等率,优良率,优秀率
- 19.按各科成绩进行排序,并显示排名
- 20.查询学生的总成绩并进行排名
- 21.查询不同老师所教不同课程平均分从高到低显示
- 22.查询所有课程的成绩第2名到第3名的学生信息及该课程成绩
- 23.统计各科成绩各分数段人数:课程编号,课程名称,[100-85],[85-70],[70-60],[0-60]及所占百分比
- 24.查询学生平均成绩及其名次
- 25.查询各科成绩前三名的记录
- 26.查询每门课程被选修的学生数
- 27.查询出只有两门课程的全部学生的学号和姓名
- 28.查询男生、女生人数
- 29.查询名字中含有"风"字的学生信息
- 30.查询同名同姓学生名单,并统计同名人数
- 31.查询1990年出生的学生名单
- 32.查询每门课程的平均成绩,结果按平均成绩降序排列,平均成绩相同时,按课程编号升序排列
- 33.查询平均成绩大于等于85的所有学生的学号、姓名和平均成绩
- 34.查询课程名称为"数学",且分数低于60的学生姓名和分数
- 35.查询所有学生的课程及分数情况
- 36.查询任何一门课程成绩在70分以上的学生姓名、课程名称和分数
- 37.查询课程不及格的学生
- 38.查询课程编号为01且课程成绩在80分以上的学生的学号和姓名
- 39.求每门课程的学生人数
- 40.查询选修"张三"老师所授课程的学生中,成绩最高的学生信息及其成绩
- 41.查询不同课程成绩相同的学生的学生编号、课程编号、学生成绩
- 42.查询每门课程成绩最好的前三名
- 43.统计每门课程的学生选修人数(超过5人的课程才统计)
- 44.检索至少选修两门课程的学生学号
- 45.查询选修了全部课程的学生信息
- 46.查询各学生的年龄(周岁)
- 47.查询本周过生日的学生
- 48.查询下周过生日的学生
- 49.查询本月过生日的学生
- 50.查询12月份过生日的学生
一.建库和建表
1.表信息
(1)课程表(course.txt)
01 语文 02
02 数学 01
03 英语 03
(2)成绩表(score.txt)
01 01 80
01 02 90
01 03 99
02 01 70
02 02 60
02 03 80
03 01 80
03 02 80
03 03 80
04 01 50
04 02 30
04 03 20
05 01 76
05 02 87
06 01 31
06 03 34
07 02 89
07 03 98
(3)学生表(student.txt)
01 赵雷 1990-01-01 男
02 钱电 1990-12-21 男
03 孙风 1990-05-20 男
04 李云 1990-08-06 男
05 周梅 1991-12-01 女
06 吴兰 1992-03-01 女
07 郑竹 1989-07-01 女
08 王菊 1990-01-20 女
(4)教师表(teacher.txt)
01 张三
02 李四
03 王五
将四张表拉到linux中的/opt/data/目录下
2.建库建表
脚本内容(setup_tables.sql)
--建库homework
create database if not exists homework;
use homework;
--创建课程表
drop table if exists course;
create table course(
c_id int,
c_name string,
t_id int
)
row format delimited
fields terminated by "\t"
stored as textfile;
--上传数据
load data local inpath'/opt/data/course.txt' overwrite into table course;
--创建成绩表
drop table if exists score;
create table score(
s_id int,
c_id int,
scores int
)
row format delimited
fields terminated by "\t"
stored as textfile;
load data local inpath'/opt/data/score.txt' overwrite into table score;
--创建学生表
drop table if exists student;
create table student(
s_id int,
s_name string,
birth string,
gender string
)
row format delimited
fields terminated by "\t"
stored as textfile;
load data local inpath'/opt/data/student.txt' overwrite into table student;
--创建教师表
drop table if exists teacher;
create table teacher(
t_id int,
t_name string
)
row format delimited
fields terminated by "\t"
stored as textfile;
load data local inpath'/opt/data/teacher.txt' overwrite into table teacher;
执行以上脚本内容
hive -f setup_tables.sql
二.练习50题(详细过程)
1.查询"01"课程比"02"课程成绩高的学生的信息及课程分数
select s.s_id,s.s_name,t3.sc1,t3.sc2 from student s
join
(select t1.s_id,t1.scores sc1,t2.scores sc2
from
(select s_id,c_id,scores from score where c_id=01) t1
join
(select s_id,c_id,scores from score where c_id=02) t2
on t1.s_id=t2.s_id
where t1.scores>t2.scores)t3
on s.s_id=t3.s_id
2.查询"01"课程比"02"课程成绩低的学生的信息及课程分数
select s.s_id,s.s_name,t3.sc1,t3.sc2 from student s
join
(select t1.s_id,t1.scores sc1,t2.scores sc2
from
(select s_id,c_id,scores from score where c_id=01) t1
join
(select s_id,c_id,scores from score where c_id=02) t2
on t1.s_id=t2.s_id
where t1.scores<t2.scores)t3
on s.s_id=t3.s_id
3.查询平均成绩大于等于60分的同学的学生编号和学生姓名和平均成绩
select
s.s_id,
s.s_name,
avg(scores) avgs
from student s
join
score sc
on s.s_id=sc.s_id
group by s.s_id,s.s_name
having avgs>60
4.查询平均成绩小于60分的同学的学生编号和学生姓名和平均成绩 (包括有成绩的和无成绩的)
--左联找出所有人的id和平均分
select
s.s_id,
avg(scores) avgs
from student s
left join score sc
on s.s_id= sc.s_id
group by s.s_id
--再在上表中找出成绩小于60分和无成绩的
select
ss.s_id,
ss.s_name,
avgs
from student ss
join
(select
s.s_id,
avg(scores) avgs
from student s
left join score sc
on s.s_id= sc.s_id
group by s.s_id) t1
on t1.s_id=ss.s_id
where avgs<60 or avgs is null
5.查询所有同学的学生编号、学生姓名、选课总数、所有课程的总成绩
select
s.s_id,s_name,count(c_id),sum(scores)
from student s
left join
score sc
on s.s_id=sc.s_id
group by s.s_id,s_name
6.查询"李"姓老师的数量
select
count(t_id)
from teacher
where t_name like '李%'
7.查询学过"张三"老师授课的同学的信息
--先查张三老师授课的id
(select
c.c_id
from course c
join teacher t
on c.t_id=t.t_id
where t_name="张三") t1
--查学过上表中课程id的学生id
(select
s_id
from score sc
join
(select
c.c_id
from course c
join teacher t
on c.t_id=t.t_id
where t_name="张三") t1
on t1.c_id =sc.c_id) t2
--通过学生id找到学生信息
select * from student st
join (select
s_id
from score sc
join
(select
c.c_id
from course c
join teacher t
on c.t_id=t.t_id
where t_name="张三") t1
on t1.c_id =sc.c_id) t2 on st.s_id=t2.s_id
8.查询没学过"张三"老师授课的同学的信息
select * from student st
left join (select
s_id
from score sc
join
(select
c.c_id
from course c
join teacher t
on c.t_id=t.t_id
where t_name="张三") t1
on t1.c_id =sc.c_id) t2 on st.s_id=t2.s_id
where t2.s_id is null
9.查询学过编号为"01"并且也学过编号为"02"的课程的同学的信息
select * from student s
join
(select t1.s_id from
(select s_id from score where c_id =1) t1
join
(select s_id from score where c_id =2) t2
on t1.s_id=t2.s_id) t3
on s.s_id=t3.s_id