文章目录
二、Hive 的安装
1、Hive 安装地址
1.1 Hive 官网地址
- http://hive.apache.org/
1.2 文档查看地址
- https://cwiki.apache.org/confluence/display/Hive/GettingStarted
1.3 下载地址
- http://archive.apache.org/dist/hive/
1.4 GitHub 地址
- https://github.com/apache/hive
2、MySQL 安装
(详见博文 Hive 安装之 MySQL 安装)
3、Hive 安装
3.1 把 apache-hive-3.1.2-bin.tar.gz 上传到 linux 的 /opt/software 目录下
3.2 解压 apache-hive-3.1.2-bin.tar.gz 到 /opt/module/ 目录下面
[xiaoxq@hadoop105 ~]$ tar -zxvf /opt/software/apache-hive-3.1.2-bin.tar.gz -C /opt/module/
3.3 修改 apache-hive-3.1.2-bin.tar.gz 的名称为 hive
drwxrwxr-x. 9 xiaoxq xiaoxq 4096 7月 29 18:16 apache-hive-3.1.2-bin
[xiaoxq@hadoop105 module]$ mv apache-hive-3.1.2-bin/ hive-3.1.2
[xiaoxq@hadoop105 module]$ ll
drwxrwxr-x. 9 xiaoxq xiaoxq 4096 7月 29 18:16 hive-3.1.2
3.4 修改/etc/profile.d/my_env.sh,添加环境变量
[xiaoxq@hadoop105 hive-3.1.2]$ sudo vim /etc/profile.d/my_evn.sh
3.5 添加内容
#HIVE_HOME
export HIVE_HOME=/opt/module/hive-3.1.2
export PATH=$PATH:$HIVE_HOME/bin
[xiaoxq@hadoop105 hive-3.1.2]$ source /etc/profile
3.6 解决日志Jar包冲突
[xiaoxq@hadoop105 lib]$ pwd
/opt/module/hive-3.1.2/lib
[xiaoxq@hadoop105 lib]$ mv log4j-slf4j-impl-2.10.0.jar log4j-slf4j-impl-2.10.0.bak
4、Hive 元数据配置到 MySQL
4.1 拷贝驱动
- 将 MySQL 的 JDBC 驱动拷贝到Hive的lib目录下
[xiaoxq@hadoop105 software]$ cp /opt/software/mysql-connector-java-5.1.37.jar /opt/module/hive-3.1.2/lib/
4.2 配置 Metastore 到 MySQL
- 在 $HIVE_HOME/conf 目录下新建 hive-site.xml 文件
[xiaoxq@hadoop105 conf]$ vim hive-site.xml
- 添加如下内容
<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration>
<!-- jdbc连接的URL -->
<property>
<name>javax.jdo.option.ConnectionURL</name>
<value>jdbc:mysql://hadoop105:3306/metastore?useSSL=false</value>
</property>
<!-- jdbc连接的Driver-->
<property>
<name>javax.jdo.option.ConnectionDriverName</name>
<value>com.mysql.jdbc.Driver</value>
</property>
<!-- jdbc连接的username-->
<property>
<name>javax.jdo.option.ConnectionUserName</name>
<value>root</value>
</property>
<!-- jdbc连接的password -->
<property>
<name>javax.jdo.option.ConnectionPassword</name>
<value>123456</value>
</property>
<!-- Hive默认在HDFS的工作目录 -->
<property>
<name>hive.metastore.warehouse.dir</name>
<value>/user/hive/warehouse</value>
</property>
<!-- 指定hiveserver2连接的端口号 -->
<property>
<name>hive.server2.thrift.port</name>
<value>10000</value>
</property>
<!-- 指定hiveserver2连接的host -->
<property>
<name>hive.server2.thrift.bind.host</name>
<value>hadoop105</value>
</property>
<!-- 指定存储元数据要连接的地址 -->
<property>
<name>hive.metastore.uris</name>
<value>thrift://hadoop105:9083</value>
</property>
<!-- 元数据存储授权 jdbc方式想要连接元数据得关闭-->
<property>
<name>hive.metastore.event.db.notification.api.auth</name>
<value>false</value>
</property>
<!-- Hive元数据存储版本的验证 jdbc方式想要连接元数据得关闭-->
<property>
<name>hive.metastore.schema.verification</name>
<value>false</value>
</property>
<!-- hiveserver2的高可用参数,开启此参数可以提高hiveserver2的启动速度 -->
<property>
<name>hive.server2.active.passive.ha.enable</name>
<value>true</value>
</property>
</configuration>
5、安装 Tez 引擎
- ( 详见博文 Hive 的安装之 Tez 引擎的安装 )
6、Hive 的启动
- ( 详见博文 Hive 的安装之 Hive 的启动 )
7、Hive 常用交互命令
8、Hive 其他命令操作
- ( 7、8 详见 博文 Hive 的常用命令 )