Hive安装
hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。
Hive是一个客户端工具,需要在哪台机器上运行就在哪台机器上安装,根据metastore的位置可以将hive的安装模式分为3种:内嵌模式,本地模式,远程模式。
Hive的安装是需要在hadoop基础上的,关于hadoop集群的搭建在之前已经讲过,在此基础上我们来安装hive。
1 在master机器的~目录下解压hive-0.7.1.tar.gz,并重命名为hive。
2 在~/.bashrc中添加以下内容:
3 在HDFS中建立tmp和/user/hive/warehouse目录并改写权限
4 在命令行下输入hive,出现如下界面,则安装成功。
以上是内嵌模式的安装过程,内嵌模式仅仅允许一个会话,只适用于简单的测试。
如果要支持多用户多会话,则需要一个独立的元数据库,目前比较流行的是使用mysql作为元数据库,配置一个独立的元数据库需要在内嵌的基础上增加以下步骤。
5 在本地安装mysql客户端和服务器端,并启动mysql服务。
sudo apt-get install mysql-server mysql-client
6 为hive建立相应的mysql账号,并赋予足够的权限。
7 建立hive专用的数据库
8 修改HIVE_HOME/conf目录下的hive-site.xml文件(如果不存在,从hive-default.xml复制)
打开hive-site.xml文件,修改以下属性值:
9 将mysql的驱动包放到HIVE_HONE/lib目录下
10 在命令行下输入hive,出现如下界面,则安装成功。
以上是hive独立模式的安装,hive的独立模式可以满足大多数的开发需要。
在独立模式的基础上,我们来配置远程模式
11 打开HIVE_HOME/conf/hive-site.xml文件,修改如下两项:
(其中的192.168.0.21是远程mysql所在的地址)
添加如下一项
(其中的192.168.0.21是hive所在的地址)
12 启动如下两项服务(在此之前,保证你的远程mysql已经启动)
13 在命令行下输入hive,出现如下界面,则安装成功。
以上是远程模式的安装过程。