一、安装数据库mysql、hadoop以及对应的jdk坏境
java version "1.8.0_141"
Java(TM) SE Runtime Environment (build 1.8.0_141-b15)
Java HotSpot(TM) 64-Bit Server VM (build 25.141-b15, mixed mode)
Hadoop 2.10.1
Subversion https://github.com/apache/hadoop -r 1827467c9a56f133025f28557bfc2c562d78e816
Compiled by centos on 2020-09-14T13:17Z
Compiled with protoc 2.5.0
二、安装hive
hive-2.x与hadoop-2.x匹配,hive-3.x与hadoop-3.x匹配。数据库主要是存放hive的元数据,可选,本文以mysql为例。
下载hive到/usr/loacl目录下
cd /usr/local/
wget https://mirrors.tuna.tsinghua.edu.cn/apache/hive/hive-2.3.9/apache-hive-2.3.9-bin.tar.gz
解压hive安装文件,并更名
tar -zxvf apache-hive-2.3.9-bin.tar.gz
mv apache-hive-2.3.9-bin/ apache-hive-2.3.9/
主要有两个配置文件要进行修改:hive-default.xml 和 hive-site.xml 。在hive安装的conf目录下,复制一个"hive-default.xml.template",命名为hive-default.xml,及新建一个文件hive-site.xml。
1.复制hive-default.xml
cd apache-hive-2.3.9/conf
cp hive-default.xml.template hive-default.xml
2.配置hive-site.xml
<?xml version="1.0" encoding="UTF-8" standalone="no"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration>
<!-- mysql 连接用户名 -->
<property>
<name>javax.jdo.option.ConnectionUserName</name>
<value>root</value>
</property>
<!-- mysql 连接密码 -->
<property>
<name>javax.jdo.option.ConnectionPassword</name>
<value>root</value>
</property>
<!-- mysql 连接URL 如果hive和mysql在同一服务器上,使用localhost -->
<property>
<name>javax.jdo.option.ConnectionURL</name>
<value>jdbc:mysql://localhost:3306/hive?createDatabaseIfNotExist=true</value>
</property>
<!-- mysql 连接驱动 -->
<property>
<name>javax.jdo.option.ConnectionDriverName</name>
<value>com.mysql.cj.jdbc.Driver</value>
</property>
</configuration>
添加连接数据库的包到hive安装的lib目录下lib目录下
下载mysql驱动jar包
jar包下载:https://mvnrepository.com/artifact/mysql/mysql-connector-java/8.0.21
或
wget https://repo1.maven.org/maven2/mysql/mysql-connector-java/8.0.21/mysql-connector-java-8.0.21.jar
三、初始化元数据库
cd /usr/local/apache-hive-2.3.9/bin
schematool -dbType mysql -initSchema
等到completed的结果就成功了 ,并且可以发现数据库中多了hive的库
添加hive环境变量
vim /etc/profile
末尾添加如下内容:
export HIVE_HOME=/usr/local/apache-hive-2.3.9
export PATH=$PATH:$HIVE_HOME/bin
使环境变量生效
source /etc/profile
四、启动hive
直接使用hive命令就可以启动
hive
启动成功后会进入 hive>