实验 目的 要求 | 掌握数据仓库工具Hive的安装方法并掌握Hive的基本使用方式 | ||||
实 验 原 理 | 一、Hive工具安装配置 二、Hive工具的启动和验证 三、数据仓库Hive的使用 | ||||
使 用 仪 器 | 1、Vmware Workstation 15 2、一台物理机 3、五台虚拟机 | ||||
实 验 步 骤 | 一、Hive工具安装配置 1、上传并解压 2、配置环境变量 3、通过模板生成配置文件 4、修改hive-env.sh 5、依次启动zookeeper,hadoop,hbase Cluster-01 Cluster-02 Cluster-03 Cluster-04 Cluster-05 6、在hadoop中配置hive 7、修改配置文件hive-site.xml 8、创建hive元数据数据库 (1)、启动mysql Cluster-01 Cluster-02 Cluster-03 Cluster-04 Cluster-05 (2)、建立数据库 9、修改配置文件,添加mysql相关信息 10、将mysql驱动包添加到hive的lib目录下 11、继续添加mysql配置 结果如下 12、初始化hive 二、Hive工具的启动和验证 1、启动hive 2、hive功能测试 三、数据仓库Hive的使用 1、常用命令 2、内部表 3、分区表 在admin用户家目录下新建sampledata.txt内容: 将文本数据插入到数据表: 创建分区表: 向分区表中插入数据: 4、外部表 在admin家目录下分别以下准备数据: 将文件放入HDFS文件系统: 创建外部表并查询: 删除HDFS上的student1.txt并查询外部表: 将studentl.txt重新放入HDFSinput目录下并查询外部表: 5、桶表 新建一个非桶表: 在admin家目录下分别以下准备数据: 插入数据并查看: 6、视图 创建一个测试表: 使用explain命令查看创建View的命令是如何被Hive解释执行的: 创建一个View: 执行View之前,先explain村看实际被翻译后的执行过程: 对View执行一次查询,显示Stage-1阶段对原始表test进行了MapReduce过程: | ||||
教 师 评 语 | |||||
Hadoop集群下:Hive的安装与使用
于 2021-07-07 09:09:25 首次发布