hive是hadoop的一个数据储存、管理工具,在这里,先记录配置过程,后面再讲述原理;
配置hive,hive是一个数据储存管理、管理工具,如果不配置相关的数据库的话,就会使用hive自带的数据库Derby,但是目前常用的数据库是mysql,方便容易使用;所以本次就是配置hive-2.3.4+mysql-5.5+ubuntu14-lts版本;
1.安装mysql:直接ubuntu的三条命令就可以了;
1.sudo apt-get install mysql-server
2.apt-get isntall mysql-client
3.sudo apt-get install libmysqlclient-dev
安装过程中会提示设置用户名和密码,依次设置即可,过程不表;
1.解压hive-2.3.4
tar -zxvf apache-hive-2.3.4-bin.tar.gz
解压后,配置hive-site.xml,配置内容如下:
<configuration>
<property>
<name>javax.jdo.option.ConnectionURL</name>
<value>jdbc:mysql://hadoop1:3306/hive?createDatabaseIfNotExist=true</value>
</property>
<property>
<name>javax.jdo.option.ConnectionDriverName</name>
<value>