一、Hive简介
Hive 是基于 Hadoop 的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供完整的 SQL 查询功能,将类 SQL 语句转换为 MapReduce 任务执行。
二、环境准备
zookeeper-3.4.6,hadoop-2.7.2 , mysql-5.7.24-linux-glibc2.12-x86_64
三台机器: master 、slave1、slave2
对于zookeeper集群环境的搭建请参考https://mp.csdn.net/postedit/84201320
对于hadoop集群环境的搭建请参考https://mp.csdn.net/postedit/84405238
对于MySQL的安装请参考https://mp.csdn.net/postedit/84679543
三:hive环境的搭建
1.下载Hive2.1.1安装包
wget http://www.apache.org/dyn/closer.cgi/hive/
或者直接去国内的清华大学 网易等镜像网站下载
解压至 /app/hive/目录下,这样管理目录更清晰。
tar -zxvf apache-hive-1.2.1-bin.tar.gz
2.配置环境变量
vim /etc/profile
让环境变量生效
source /etc/profile
3:修改hive配置文件
cd apache-hive-1.2.1-bin/conf
修改hive-env.sh文件
cp hive-env.sh.template hive-env.sh
将以下内容写入到hive-env.sh文件中
修改log4j文件
cp hive-log4j.properties.template hive-log4j.properties
将EventCounter修改成org.apache.hadoop.log.metrics.EventCounter
配置远程登录模式
vim hive-site.xml
将以下信息写入到hive-site.xml文件中
4:配置mysql-connector-java-5.0.3-bin.jar包
cd /lib
通过ftp上传到/lib目录下
查看是否有mysql-connector-java-5.0.3-bin.jar包
ll my*
5:启动hive
cd bin/hive
出现下面的结果则hive集群环境搭建成功。