Hive的安装、配置与Shell入门操作
一、实验目的与要求
目的:理解Hive在Hadoop体系结构中的角色,掌握 Hive 的安装部署及Mysql的安装与配置,掌握Hive Shell的常用命令与非交互式命令。
要求:1.在已安装Hadoop的基础上安装配置好Hive并运行
2.在Hive Shell下,根据题目要求创建一个表
3.完成实验报告。
二、实验内容
1. Hive的基本安装
2. Mysql的安装与设置
3. Hive的设置
4. Hive Shell常用命令
5.Hive Shell 非交互式运行
三、实验环境
头歌实践平台
四、实验过程记录
1. Hive的基本安装
(1)进入/opt目录,解压apache-hive-3.1.0-bin.tar.gz到该目录下,并将解压的文件重命名为hive。
(2)设置环境变量,编辑vi /etc/profile并使环境生效;
- 查看hive是否安装成功
说明:出现hive版本就说明安装成功,但是可以看到其中有一些警告信息,是由于包的冲突引起的。我们只需删除掉引起冲突的包即可:
rm /opt/hive/lib/log4j-slf4j-impl-2.10.0.jar。
2. Mysql的安装与设置
(1)下载mysql驱动:进入/opt目录并解压mysql压缩包,将解压后的文件复制到hive/lib目录下。
(2)使用root用户登录MySQL数据库
(3)创建数据库实例hiveDB;
(4)创建用户bee,密码为123123;
(5)授权用户bee拥有数据库实例hiveDB的所有权限;
(6)刷新系统权限表。
3. Hive的设置
(1)创建hive-site.xml文件,并进行设置。
(2)复制hive-env.sh.template并命名为hive-env.sh,对hive-env.sh进设置。
(3)执行初始化命令
(4)启动hadoop
4. Hive Shell常用命令
启动 Hive Shell并进行如下操作(截图内容为要求依次向下)
- 查询数据库
- 查询表
- 创建数据库mydb
- 删除数据库mydb:
- 创建表mytable,有id字段,数据类型为int
- 删除表mytable
- 退出 Hive Shell
- Hive Shell 非交互式运行
直接在Linux的命令行操作Hive:查询数据库
说明:在Hive的交互式模式和非交互式模式下,执行HiveQL操作都会输出执行过程信息,如执行查询操作所用时间,通过指定-S选项可以禁止输出此类信息。
- 在Hive Shell下创建一个表student,表结构如下:
col_name | data_type |
id | int |
name | string |
age | int |
- 在student表中插入三行数据
- 新建脚本s1.sql,实现以下功能(1)查询student表中的所有信息 (2)student表中id为1的信息(3)查询student表中记录总数,并将查询结果写入hive目录下的s1.txt。
- 编辑s1.sql文件,内容如下:
- 查看s1.txt文件,结果如下:
9.不进入 hive 的交互窗口执行 sql 语句,查询student表中的所有姓名。