本文介绍hive版本2安装的整个过程
一、介绍hive metastore的三种配置:
1、内嵌模式:embedded metastore database(derby)
2、本地模式:本地元存储 local metastore database
3、远程模式:远程元存储 remote metastore database
metadata 即元数据。元数据包括用Hive创建的database、table等元数据信息。元数据存储在关系型数据库中,比如:derby、mysql。
Metastore的作用:客户端连接metastore服务,metastore再去连接mysql数据库来存取元数据。有了metastore服务后,就可以有多个客户端同事连接。
区别:
* 内嵌模式使用的是内嵌的Derby数据库来存储元数据,也不需要额外起metastore服务,默认配置并简单,但是只能一个客户端连接,使用实验,不适用生产。
* 本地模式和远程模式都采用外部数据库来存储元数据,在这里我用的是mysql。
* 本地模式和远程模式的区别:本地元数据不需要单独起metastore服务,用的是跟hive在同一进程里的metastore服务。远程元存储需要单独起metastore服务,然后每个客户端都在配置文件里配置连接到metastore服务。远程元存储的metastore服务和hive运行在不同的进程里。
生产环境建议用远程元存储来配置Hive Metastore
这里安装mysql就不在赘述了。直接yum安装mysql就行;
二、安装hive
在apache官网上下载hive http://mirror.bit.edu.cn/apache/hive/hive-2.1.1/
cd /home/bigdata/BIData
tar -zxvf apache-hive-2.1.1-bin.tar.gz
mv apache-hive-2.1.1/ hive
将mysql-connector-java-5.1.40.jar包上传至hive的lib目录下面
hive0.12版本之前Hive和Hbase的外表关联需要Hive与Hbase下的lib的jar包版本统一
三、配置
配置mysql