hive的安装与使用

HadoopSQLApache.


hive的安装非常简单。官方下载地址是:http://hive.apache.org。hive目前最新版本是0.7.0,支持Hadoop 0.20.1 及 0.20.2,由于我这里hadoop的版本是0.19.2,所以我就只能用之前的版本了。我使用的版本是0.5.0,可以支持hadoop 0.17到0.20。貌似现在官网上已经没下载链接了,我放到附件供大家下载吧。

hive是依赖于hadoop的,所以安装hive之前请先装好hadoop,可以参看我的另一篇文章 hadoop的安装和使用。
将下载到的文件hive-0.5.0-bin.tar.gz解压到hadoop目录下,然后修改下环境变量 /etc/profile ,加上下面几行:



Shell代码
1.export HIVE_HOME=/data/hadoop/hive-0.5.0-bin
2.export PATH=$PATH:$HIVE_HOME/bin
3.export HADOOP_HOME=/data/hadoop

为了让刚设置的环境变量生效,需要退出终端,再重新登录。可以通过echo $HIVE_HOME命令查看,确保设置的环境变量已经生效。
好了,下面就可以使用hive了,hive用起来很简单,看下面的例子。



Shell代码
# hive
Hive history file=/tmp/root/hive_job_log_root_201106191843_199722387.txt
hive> show tables;
OK
Time taken: 10.09 seconds
hive> CREATE TABLE tt(id int,name string)
> ROW FORMAT DELIMITED
> FIELDS TE RMINATED BY ','
> STORED AS TEXTFILE;
OK
Time taken: 0.821 seconds
hive> show tables;
OK
tt
Time taken: 0.134 seconds
hive> select * from tt;
OK
Time taken: 0.245 seconds
hive> drop table tt;
OK
Time taken: 0.602 seconds
hive>

这个例子中,我们启动hive程序,新建了一个新表tt,然后做了一次查询,然后将表删除了。通过这种简单的类SQL命令,就可以进行复杂的分布式计算了,是不是感觉很爽呢。如果需要学习更复杂的操作,可以参看hive的帮助文件。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值