前言
本教程适用于初学者安装hive学习使用,很多配置,需要个人在后续的学习与使用中探索来掌握。
一、首先要安装MySQL
原因:Hive默认使用的元数据库为derby,开启Hive之后就会占用元数据库,且不与其他客户端共享数据,如果想多窗口操作就会报错,操作比较局限。以我们需要将Hive的元数据地址改为MySQL,可支持多窗口操作。
MySQL的安装可以参考我的另一篇博客
CentOS7安装mysql8_tianqin_9169的博客-CSDN博客
二、Hive安装
1、下载hive包
Index of /dist/hivehttp://archive.apache.org/dist/hive/
根据自己需求,选择想用的版本的包进行下载,我这几就以3.1.2为例,hadoop版本用的3.1.3
下载完成后进行 解压,配置环境变量--步骤省略
2、Jar包冲突
因为跟hadoop的jar包存在冲突,主要有两个jar包冲突,一个log4j-slf4j-impl-2.10.0.jar跟hadoop冲突,可以删除,我这里就打个标记弃用。
mv $HIVE_HOME/lib/log4j-slf4j-impl-2.10.0.jar $HIVE_HOME/lib/log4j-slf4j-impl-2.10.0.bak
另一个时guava-19.0.jar,跟hadoop里面的guava-27.0-jre.jar冲突,采用高版本替换低版本的方式。
cp $HADOOP_HOME/share/hadoop/common/lib/guava-27.0-jre.jar $HIVE_HOME/lib
rm $HIVE_HOME/lib/guava-19.0.jar
3、将MySQL的JDBC驱动拷贝到Hive的lib目录下
我这里选用的8.0.16自己可以选择版本去下载