HDFS、Hive(Impala)读取本地文件到HDFS,再使用Hive(Impala)从HDFS读取文件进行建表

本文介绍了如何使用HDFS将本地文件上传至HDFS,然后通过Hive和Impala从HDFS读取文件进行建表。详细步骤包括启动Hive和Impala shell,创建HDFS目录,上传文件,以及编写SQL查询来统计员工的培训小时数、平均时长和次数。示例数据包括员工的安全培训记录,通过查询找出总培训小时数超过8小时的员工。
摘要由CSDN通过智能技术生成

Hive Impala的用法相同,Hive直接输入hive就能启动,Impala使用Impala-shell命令进行启动

下面用一道题进行讲解这个过程:

给定一个企业对员工进行的安全培训数据表TrainingRecord(如下图),包括姓名(Name),培训日期(Date)和培训小时数(Hours),请写出相应的SQL查询回答下列问题:

1)查询每个员工的总培训小时数平均培训时长培训次数,并给出结果集;

2)查询

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值