一、安装准备
1、下载hive-0.5.0-bin版本:http://apache.etoak.com/hadoop/hive/hive-0.5.0/
2、JDK版本:jdk-6u20-linux-i586.bin
3、操作系统:Linux s132 2.6.9-78.8AXS2smp #1 SMP Tue Dec 16 02:42:55 EST 2008 x86_64 x86_64 x86_64 GNU/Linux
4、默认前提是安装完hadoop 0.20.2版本:
192.168.3.131 namenode
192.168.3.132 datanode
192.168.3.133 datanode
二、安装操作
1、拷贝以上文件到Linux的“/root”目录下。同时新建目录“/jz”。
2、安装JDK,此步省略...
3、解压hive到/jz目录下。tar -zxvf hive-0.5.0-bin.tar.gz -C /jz
4、进入/jz/hive-0.5.0-bin/conf目录,复制hive-default.xml,改名为hive-site.xml文件。
三、启动操作
1、在/jz/目录下创建hive-user文件夹,并在该文件夹下创建文件夹hive.kaka。目录结构为:/jz/hive-user/hive.kaka
2、在/jz/hive-user/hive.kaka目录下创建文件cli,该文件内容为:
#!/bin/bash /jz/hive-0.5.0-bin/bin/hive3、sh /jz/hive-user/hive.kaka/cli 启动hive服务,进入cli控制台。
4、输入show tables;控制台如果返回OK,表示启动成功。
四、注意和总结
1、创建私有的cli文件的目的是为了避免使用嵌入式的数据库出现多人操作同一个的现象,而且多人操作,即使进入cli也会报错。
2、如果想多建用户,可以在/jz/hive-user目录下建立目录,存放进去相同的cli文件,启动私有的cli控制台。这样元数据将存放在自己的目录下。
3、metastore_db为存储私有的元数据(表属性和结构的内容)的地方,如果删除,那么你的表结构将不存在(数据文件还是存放在HDFS中)。当然,也可以拷贝其他用户的metastore_db文件夹到自己的目录下,这样就实现和其他用户同样的元数据结构。
4、总体的目录结构如下:
5、对于hive的一些链接使用方法(例如JDBC/ODBC、嵌入式/客户端式),我将考虑在后面的文章中详细写写。
6、有疑问或是写的不对的地方欢迎大家发邮件交流:dajuezhao@gmail.com