Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射成一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为mapreduce任务进行运行它的优点是学习成本低,可以通过类sql语句快速实现简单的mapreduce统计
一、目的及要求
目的:*数据仓库工具Hive的安装和配置
*掌握数据仓库工具hive的安装和配置
要求
*完成Hive工具的安装和配置
*Hive工具能够正常启动运行
*Hive控制台命令能正常使用
*能够正常操作数据库、表、数据
二、实验环境
一台独立PC机或虚拟机
每台主机内存2G以上,磁盘剩余空间500M以上
已安装CentOS 7.4操作系统
已安装JDK
已完成Hadoop平台的搭建
已完成MySQL数据库平台的搭建
三、步骤
- Hive工具安装配置
1、创建目录上传Hive相关软件包
2、配置Hive相关环境变量