02、Hive数据仓库——SQL员工练习题

21 篇文章 4 订阅

文章目录

Hive数据仓库——SQL员工练习题

一:将下列数据加载hive表。

  • test_emp数据库
create database test_emp;
use test_emp;
  • 员工信息表emp
字段:员工id,员工名字,工作岗位,部门经理,受雇日期,薪水,奖金,部门编号
英文名:EMPNO,ENAME,JOB,MGR,HIREDATE,SAL,BONUS,DEPTNO
create table emp(
    EMPNO int
    ,ENAME string
    ,JOB string
    ,MGR int
    ,HIREDATE string
    ,SAL int
    ,BONUS int
    ,DEPTNO int
) 
row format delimited
fields terminated by ',';
  • 员工表数据

在/usr/local/soft/data目录下创建testemp.txt文件将下方数据复制进去。

7369,SMITH,CLERK,7902,1980-12-17,800,null,20
7499,ALLEN,SALESMAN,7698,1981-02-20,1600,300,30
7521,WARD,SALESMAN,7698,1981-02-22,1250,500,30
7566,JONES,MANAGER,7839,1981-04-02,2975,null,20,
7654,MARTIN,SALESMAN,7698,1981-09-28,1250,1400,30
7698,BLAKE,MANAGER,7839,1981-05-01,2850,null,30
7782,CLARK,MANAGER,7839,1981-06-09,2450,null,10
7788,SCOTT,ANALYST,7566,1987-04-19,3000,null,20
7839,KING,PRESIDENT,null,1981-11-17,5000,null,10
7844,TURNER,SALESMAN,7698,1981-09-08,1500,0,30
7876,ADAMS,CLERK,7788,1987-05-23,1100,null,20
7900,JAMES,CLERK,7698,1981-12-03,950,null,30
7902,FORD,ANALYST,7566,1981-12-03,3000,null,20
7934,MILLER,CLERK,7782,1982-01-23,1300,null,10
  • 加载员工表数据
load data local inpath '/usr/local/soft/data/testemp.txt' into table emp;
  • 部门信息表dept
字段:部门编号,部门名称,部门地点
英文名:DEPTNO,DEPTNAME,DEPTADDR
create table dept(
    DEPTNO int
    ,DEPTNAME string
    ,DEPTADDR string
) 
row format delimited
fields terminated by ',';
  • 部门信息表数据

在/usr/local/soft/data目录下创建testdept.txt文件将下方数据复制进去。

10,ACCOUNTING,NEW YORK
10,ACCOUNTING,shanghai
20,RESEARCH,DALLAS
30,SALES,CHICAGO
40,OPERATIONS,BOSTON
  • 加载部门信息表数据
load data local inpath '/usr/local/soft/data/testdept.txt' into table dept;

二:使用HQL完成下面需求

1. 列出至少有一个员工的所有部门。

  • 注意distinct
select t1.deptno
       ,t1.DEPTNAME
       ,t1.DEPTADDR
       ,t2.cnt
from dept t1
join (
    select deptno
    ,count(distinct EMPNO) as cnt
    from emp
    group by deptno
)t2
on t1.deptno = t2.deptno;

2. 列出薪金比“SMITH”多的所有员工。

  • Hive中的where条件不支持不等式的子查询,可通过join实现
select  t1.EMPNO
        ,t1.ENAME
        ,t1.sal_bonus
from (
    select  EMPNO
            ,ENAME
            ,12*SAL+nvl(BONUS,0) as sal_bonus
            ,1 as tmp_id
    from emp
) t1 
join (
    select  12*SAL+nvl(BONUS,0) as sal_bonus
            ,1 as tmp_id
    from emp
    where ENAME = 'SMITH'
) t2 on t1.tmp_id = t2.tmp_id
where t1.sal_bonus > t2.sal_bonus;

3. 列出所有员工的姓名及其直接上级的姓名。

select t1.EMPNO
       ,t2.ENAME as leader_name
from emp t1 join emp t2
on t1.MGR = t2.EMPNO;

4. 列出受雇日期早于其直接上级的所有员工。

select distinct
       t1.DEPTNO
       ,t1.DEPTNAME
       ,t2.EMPNO
       ,t2.ENAME
from dept t1
left join emp t2
on t1.DEPTNO = t2.DEPTNO;

5. 列出部门名称和这些部门的员工信息,同时列出那些没有员工的部门。

select distinct
       t1.DEPTNO
       ,t1.DEPTNAME
       ,t2.EMPNO
       ,t2.ENAME
from dept t1
left join emp t2
on t1.DEPTNO = t2.DEPTNO;

6. 列出所有“CLERK”(办事员)的姓名及其部门名称。

select t1.ENAME
       ,t2.DEPTNAME
from (
    select ENAME
           ,DEPTNO
    from emp
    where JOB = 'CLERK'       
) t1
join (
    select distinct
           DEPTNO
           ,DEPTNAME
    from dept       
) t2
on t1.DEPTNO = t2.DEPTNO;

7. 列出最低薪金大于1500的各种工作。

select t1.JOB
       ,t1.min_sal
from (
    select JOB
           ,min(SAL) as min_sal
    from emp
    group by JOB       
) t1
where t1.min_sal > 1500;

8. 列出在部门“SALES”(销售部)工作的员工的姓名,假定不知道销售部的部门编号。

select EMPNO
       ,ENAME
from emp
where DEPTNO in (
    select DEPTNO
    from dept
    where DEPTNAME = 'SALES'
);

9. 列出薪金高于公司平均薪金的所有员工。

select t1.EMPNO
       ,t1.ENAME
       ,t1.sal_bonus
from (
    select EMPNO
           ,ENAME
           ,12*SAL+nvl(BONUS,0) as sal_bonus
           ,1 as tmp_id
    from emp       
) t1 join (
    select round(avg(12*SAL+nvl(BONUS,0)),2) as avg_sal_bonus
           ,1 as tmp_id
    from emp       
) t2
on t1.tmp_id = t2.tmp_id
where t1.sal_bonus > t2.avg_sal_bonus;

10.列出与“SCOTT”从事相同工作的所有员工。

select EMPNO
       ,t1.ENAME
       ,JOB
from emp t1
where t1.ENAME != 'SCOTT'
and exists (
    select JOB
    from emp t2
    where ENAME = 'SCOTT' and t1.JOB=t2.JOB
);
select EMPNO
       ,t1.ENAME
       ,JOB
from emp t1
where t1.ENAME != 'SCOTT'
and JOB in (
    select JOB
    from emp
    where ENAME = 'SCOTT'
);

11.列出薪水等于部门30中员工的薪金的所有员工的姓名和薪水。

select t1.ENAME
        ,t1.SAL
from emp t1
where t1.DEPTNO !=30
and t1.SAL in (
    select SAL
    from emp
    where DEPTNO = 30
);

没有相关的信息

12.列出薪金高于在部门30工作的所有员工的薪金的员工姓名和薪金。

select t1.ENAME
       ,t1.sal_bonus
       ,t2.max_sal_bonus
from (
    select t1.ENAME
           ,12*t1.SAL+nvl(t1.BONUS,0) as sal_bonus
    from emp t1
    where t1.EMPNO !=30
) t1
join (
    select max(12*SAL+nvl(BONUS,0)) as max_sal_bonus
    from emp
    where DEPTNO = 30
) t2
on 1=1
where t1.sal_bonus > t2.max_sal_bonus;

13.列出在每个部门工作的员工数量、平均工资和平均服务期限。

select DEPTNO
       ,count(distinct EMPNO) as cnt
       ,round(avg(12*SAL+nvl(BONUS,0)),2) as avg_sal_bonus
       ,round(avg(datediff(current_date(),HIREDATE)),2) as avg_work_days
from emp
group by DEPTNO;

14.列出所有员工的姓名、部门名称和工资。

select t1.ENAME
       ,t1.SAL
       ,t2.DEPTNAME
       ,t2.DEPTADDR
from emp t1
join dept t2
on t1.DEPTNO = t2.DEPTNO;

15.列出所有部门的详细信息和部门人数。

select t2.DEPTNO
       ,t2.DEPTNAME
       ,t2.DEPTADDR
       ,t1.cnt
from (
    select DEPTNO
           ,count(distinct EMPNO) as cnt
    from emp
    group by DEPTNO       
)t1 right join dept t2
on t1.DEPTNO = t2.DEPTNO;

16.列出各种工作的最低工资。

select JOB
       ,min(SAL) as min_sal
from emp
group by JOB;

17.列出各个部门的MANAGER(经理)的最低薪金。

select t1.DEPTNO
       ,min(12*SAL+nvl(BONUS,0)) as min_sal_bonus
from (
    select DEPTNO
           ,SAL
           ,BONUS
    from emp
    where JOB = 'MANAGER'
)t1
group by t1.DEPTNO;

18.列出所有员工的年工资,按年薪从低到高排序。

select EMPNO
       ,ENAME
       ,12*SAL+nvl(BONUS,0) as year_sal
from emp
order by year_sal;

19. 列出每个部门薪水前两名最高的人员名称以及薪水。

select t1.DEPTNO
       ,t1.ENAME
       ,t1.SAL
       ,t1.rn
from (
    select DEPTNO
           ,ENAME
           ,SAL
           ,row_number() over (partition by DEPTNO ORDER by SAL DESC) as rn
    from emp
) t1
where t1.rn <= 2;

20. 列出每个员工从受雇开始到2018-12-12 为止共受雇了多少天。

select EMPNO
       ,ENAME
       ,datediff('2018-12-12',HiREDATE) as days
from emp;

到底啦!关注靓仔学习大数据!

  • 15
    点赞
  • 59
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 7
    评论
### 回答1: Hive是一个基于Hadoop的数据仓库工具,提供了类似于SQL的查询语言HiveQL,可以方便地进行数据分析和查询,适合大规模的数据处理。 在Hive的案例教程中,通常会包含一些习题,以帮助学习者更好地理解和掌握Hive的使用。这些习题可以涉及到不同的数据仓库场景和问题,下面是一个示例: 假设我们有一个电商平台的销售数据,其中包含了订单表和商品表。订单表包括了订单ID、用户ID、商品ID、购买数量和购买日期等信息;商品表包括了商品ID、商品名称、商品价格和商品分类等信息。 1. 统计每个用户的购买总金额,并按照金额从高到低排序。 可以通过使用Hive的聚合函数和排序功能来实现这个需求。首先,需要使用JOIN操作将订单表和商品表进行关联,根据商品ID找到对应的商品价格。然后,通过GROUP BY用户ID进行分组,使用SUM函数计算每个用户的购买总金额。最后,使用ORDER BY将结果按照金额从高到低排序。 2. 统计每个商品分类的销售数量和销售金额。 同样地,可以通过使用JOIN操作将订单表和商品表进行关联。然后,通过GROUP BY商品分类进行分组,分别使用COUNT和SUM函数计算每个商品分类的销售数量和销售金额。 3. 找出销售金额最高的前5个商品。 可以通过使用ORDER BY和LIMIT子句来实现这个需求。先通过JOIN操作将订单表和商品表进行关联,然后使用SUM函数计算每个商品的销售金额。最后,使用ORDER BY对销售金额进行降序排序,并使用LIMIT 5获取前5个商品。 通过完成这些习题,可以深入理解Hive数据仓库功能,掌握基本的数据查询和分析。同时,也能够提升对数据仓库设计和实践的理解和能力。 ### 回答2: Hive数据仓库案例教程习题是一种用于学习和实践Hive数据仓库的教育资源。它通过提供一系列的案例和习题,帮助学习者深入理解Hive数据仓库的概念与应用,并通过实践加深对Hive的掌握。 该教程习题通常包括以下内容: 1. 数据准备:习题提供了一些数据资料,学习者需要根据具体的案例要求将数据导入到Hive中。这一步通常涉及到创建、管理表格、上传数据等操作。 2. 数据分析:习题会提供一些具体的问题或需求,学习者需要通过Hive的查询语句进行数据分析。这一步要求学习者熟悉Hive的查询语法和常用函数,并能够编写出符合要求的查询语句。 3. 结果验证:学习者需要将自己查询得到的结果与提供的标准答案进行对比。这一步能够检验学习者对Hive查询的准确性和熟练程度。 通过完成这些案例教程习题,学习者可以逐步提升对Hive数据仓库的理解和实践能力。同时,这些习题也能够帮助学习者巩固理论知识,拓宽在实际应用场景中的思考和解决问题的能力。 总之,Hive数据仓库案例教程习题是一种有助于学习者掌握Hive数据仓库技术的教育资源,通过实践案例和习题,提升学习者的理论实践能力和问题解决能力。 ### 回答3: Hive数据仓库案例教程习题是为了帮助学习者更好地理解和掌握Hive数据仓库的相关知识和技能而设计的一系列练习题。 这些习题通常会根据实际的数据仓库案例进行设计,包括数据的导入和清洗、数据的转换和处理、数据的查询和分析等方面的内容。学习者可以通过完成这些习题,加深对Hive数据仓库的理解,并且提高自己在实际应用中的能力。 在这些习题中,学习者需要运用到Hive的相关操作语句和函数,例如创建和管理表、加载和导入数据、定义表结构和分区等。同时,学习者还需要了解Hive的查询语言,如SQL,以及Hive的高级功能,如UDF自定义函数等。通过这些习题,学习者可以从实际操作中不断提高和完善自己的技能。 总的来说,Hive数据仓库案例教程习题是一种亲身实践的学习方法,通过实际的案例和练习,帮助学习者更好地掌握和应用Hive数据仓库的技术,达到提升数据分析和处理能力的目的。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 7
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

liangzai2048

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值