1.下载与你hadoop对应的hive tar安装包,在这里我的hadoop是hadoop-2.6.0-cdh5.7.0的版本,所以需要去下载cdh同样为5.7.0的hive-1.1.0-cdh5.7.0.tar.gz包,然后上传至linux系统上的software目录下。
[root@hadoop001 ~]# su - hadoop
[hadoop@hadoop001 ~]$ rz
[hadoop@hadoop001 ~]$ mv hive-1.1.0-cdh5.7.0.tar.gz ./software/
2.在software目录下解压tar包并在app目录下创建软连接
[hadoop@hadoop001 software]$ tar -zxvf hive-1.1.0-cdh5.7.0.tar.gz
[hadoop@hadoop001 software]$ cd …/app/
[hadoop@hadoop001 app]$ ln -s ~/software/hive-1.1.0-cdh5.7.0 ~/app/hive
3.配置hive的环境变量,在配置Hive的环境变量之前需要先配置Hadoop的环境变量,这里我们之前已配置过了 [hadoop@hadoop001 app]$ vi ~/.bash_profile
export HADOOP_HOME=/home/hadoop/app/hadoop export HIVE_HOME=/home/hadoop/app/hive export PATH=${HIVE_HOME}/bin:${HADOOP_HOME}/bin:${HADOOP_HOME}/sbin:${PATH}
保存并刷新生效
[hadoop@hadoop001 app]$ source ~/.bash_profile
4.安装MySQL,因为我们hive源数据要存储在MySQL中,这里我们之前已经安装过了(点击参考链接)
5.下载MySQL的驱动包并cp到hive的lib目录下
[hadoop@hadoop001 ~]$ mv mysql-connector-java-5.0.8-bin.jar ./app/hive/lib/
6.修改hive-site.xml配置文件,但是默认的hive的conf目录下是没有该模板的,所以需要我们来弄
<?xml version="1.0"?> <?xml-stylesheet type="text/xsl" href="configuration.xsl"?> <configuration> </configuration>
然后修改hive-site.xml配置文件 [hadoop@hadoop001 conf]$ vi hive-site.xml
<?xml version="1.0"?> <?xml-stylesheet type="text/xsl" href="configuration.xsl"?> <configuration> <property> <name>javax.jdo.option.ConnectionURL</name> <value>jdbc:mysql://localhost:3306/hiveMetadataDB?createDatabaseIfNotExist=true</value> </property> <property> <name>javax.jdo.option.ConnectionDriverName</name> <value>com.mysql.jdbc.Driver</value> </property> <property> <name>javax.jdo.option.ConnectionUserName</name> <value>hwz</value> </property> <property> <name>javax.jdo.option.ConnectionPassword</name> <value>123456</value> </property> <property> <name>hive.cli.print.current.db</name> <value>true</value> </property> <property> <name>hive.cli.print.header</name> <value>true</value> </property> </configuration>
7.然后启动hive即可
-------------------------------------hive安装结束-------------------------------------
补充:关于hive元数据在mysql存储的位置,在你指定的mysql数据库下的以下表
DBS:存放的hive数据库元数据信息
VERSION:有且只能存放一条记录,该记录为hive的版本元数据信息
TBLS:存放的是所有表的元数据信息
COLUMNS_V2:存放的是所有字段的元数据信息