本实验使用的Hive版本为3.1.2。
1、 Hive的3种运行模式:
- 内嵌模式:将元数据保存在本地内嵌的 Derby 数据库中,这是使用 Hive 最简单的方式。但是这种方式缺点也比较明显,因为一个内嵌的Derby 数据库每次只能访问一个数据文件,这也就意味着它不支持多会话连接。
- 本地模式:这种模式是将元数据保存在本地独立的数据库中(一般是 MySQL),这就可以支持多会话和多用户连接了。
- 远程模式:此模式应用于Hive 客户端较多的情况。把 MySQL 数据库独立出来,将元数据保存在远端独立的 MySQL 服务中,避免了在每个客户端都安装MySQL 服务从而造成冗余浪费的情况。
2、安装Hive
本项目使用Hive远程模式。
(1)解压安装Hive
tar -zxf /opt/hadoop/apache-hive-3.1.2-bin.tar.gz -C ~/
(2)修改配置文件hive-site.xml
<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration>
<property>
<name>javax.jdo.option.ConnectionURL</name>
<value>jdbc:mysql://localhost:3306/hive_21?ch