准备
并没有集群一说, 只要Hadoop以集群的模式运行, Hive就可以在Hadoop集群中运行。Hive 是基于 Hadoop 的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供完整的 SQL 查询功能,将类 SQL 语句转换为 MapReduce 任务执行。
Hive的下载地址
http://mirror.bit.edu.cn/apache/hive/
这里使用的版本是apache-hive-2.3.7-bin.tar.gz
环境准备
hadoop-2.7.3
三台机器:
master 、slave1、slave2
解压
tar -zxvf apache-hive-2.3.7-bin.tar.gz
ln -s apache-hive-2.3.7-bin hive-2.3.7
设置环境变量
export HIVE_HOME=/home/hadoop/hive-2.3.7
PATH=$PATH:$HOME/bin:$HADOOP_HOME/bin:$HADOOP_HOME/sbin:$HBASE_HOME/bin:$ZOOKEEPER_HOME/bin:$HIVE_HOME/bin
准备mysql的环境
配置hive
1. 修改hive-site.xml
cp hive-default.xml.template hive-site.xml
vi hive-site.xml
修改如下四项的内容
<property>
<name>javax.jdo.option.ConnectionUserName</name>
<value>mysql.用户名</value>
</property>
<property>
<name>javax.jdo.option.ConnectionPassword</name>
<value>mysql.密码</value>
</property>
<property>
<name>javax.jdo.option.ConnectionURL</name>mysql
<value>mysql.url</value>
</property>
<property>
<name>javax.jdo