Hadoop集群下:Hive的安装与使用

实验

目的

要求

掌握数据仓库工具Hive的安装方法并掌握Hive的基本使用方式

   、Hive工具安装配置

二、Hive工具的启动和验证

三、数据仓库Hive的使用

使

   1、Vmware Workstation 15

   2、一台物理机

   3、五台虚拟机

一、Hive工具安装配置

1、上传并解压

2、配置环境变量

3、通过模板生成配置文件

4、修改hive-env.sh

5、依次启动zookeeper,hadoop,hbase

Cluster-01

Cluster-02

Cluster-03

Cluster-04

Cluster-05

6、在hadoop中配置hive

7、修改配置文件hive-site.xml

8、创建hive元数据数据库

(1)、启动mysql

Cluster-01

Cluster-02

Cluster-03

Cluster-04

Cluster-05

(2)、建立数据库

9、修改配置文件,添加mysql相关信息

10、将mysql驱动包添加到hive的lib目录下

11、继续添加mysql配置

结果如下

12、初始化hive

二、Hive工具的启动和验证

1、启动hive

2、hive功能测试

三、数据仓库Hive的使用

1、常用命令

2、内部表

3、分区表

在admin用户家目录下新建sampledata.txt内容:

将文本数据插入到数据表:

创建分区表:

向分区表中插入数据:

4、外部表

在admin家目录下分别以下准备数据:

将文件放入HDFS文件系统:

创建外部表并查询:

删除HDFS上的student1.txt并查询外部表:

将studentl.txt重新放入HDFSinput目录下并查询外部表:

5、桶表

新建一个非桶表:

在admin家目录下分别以下准备数据:

插入数据并查看:

6、视图

创建一个测试表:

使用explain命令查看创建View的命令是如何被Hive解释执行的:

创建一个View:

执行View之前,先explain村看实际被翻译后的执行过程:

对View执行一次查询,显示Stage-1阶段对原始表test进行了MapReduce过程:

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值