前期准备
Hive是基于Hadoop的一个数据仓库工具,Hive处理的数据存储在HDFS上,分析数据底层默认实现是MapReduce,执行的程序运行在Yarn,所以安装Hive之前需要搭建好Hadoop集群。
默认存储元数据的数据库为Derby,为了避免使用默认的Derby数据库(有并发访问和性能的问题),通常还需要将元数据库配置为MySQL。
安装流程
-
将下载好的Hive放入虚拟机,解压到 /opt 目录下:tar -zxvf apache-hive-2.3.7-bin.tar.gz
-
重命名:mv apache-hive-2.3.7-bin hive-2.3.7
-
修改 /etc/profile,配置Hive环境变量:export HIVE_HOME=/opt/hive-2.3.7,export PATH=$PATH:$HIVE_HOME/bin,source /etc/profile
-
将 /opt/hive-2.3.7/conf 目录下的 hive-env.sh.template 修改为 hive-env.sh:mv hive-env.sh.template hive-env.sh
-
配置HADOOP_HOME