HadoopSQLApache.
hive的安装非常简单。官方下载地址是:http://hive.apache.org。hive目前最新版本是0.7.0,支持Hadoop 0.20.1 及 0.20.2,由于我这里hadoop的版本是0.19.2,所以我就只能用之前的版本了。我使用的版本是0.5.0,可以支持hadoop 0.17到0.20。貌似现在官网上已经没下载链接了,我放到附件供大家下载吧。
hive是依赖于hadoop的,所以安装hive之前请先装好hadoop,可以参看我的另一篇文章 hadoop的安装和使用。
将下载到的文件hive-0.5.0-bin.tar.gz解压到hadoop目录下,然后修改下环境变量 /etc/profile ,加上下面几行:
Shell代码
1.export HIVE_HOME=/data/hadoop/hive-0.5.0-bin
2.export PATH=$PATH:$HIVE_HOME/bin
3.export HADOOP_HOME=/data/hadoop
为了让刚设置的环境变量生效,需要退出终端,再重新登录。可以通过echo $HIVE_HOME命令查看,确保设置的环境变量已经生效。
好了,下面就可以使用hive了,hive用起来很简单,看下面的例子。
Shell代码
# hive
Hive history file=/tmp/root/hive_job_log_root_201106191843_199722387.txt
hive> show tables;
OK
Time taken: 10.09 seconds
hive> CREATE TABLE tt(id int,name string)
> ROW FORMAT DELIMITED
> FIELDS TE RMINATED BY ','
> STORED AS TEXTFILE;
OK
Time taken: 0.821 seconds
hive> show tables;
OK
tt
Time taken: 0.134 seconds
hive> select * from tt;
OK
Time taken: 0.245 seconds
hive> drop table tt;
OK
Time taken: 0.602 seconds
hive>
这个例子中,我们启动hive程序,新建了一个新表tt,然后做了一次查询,然后将表删除了。通过这种简单的类SQL命令,就可以进行复杂的分布式计算了,是不是感觉很爽呢。如果需要学习更复杂的操作,可以参看hive的帮助文件。
hive的安装非常简单。官方下载地址是:http://hive.apache.org。hive目前最新版本是0.7.0,支持Hadoop 0.20.1 及 0.20.2,由于我这里hadoop的版本是0.19.2,所以我就只能用之前的版本了。我使用的版本是0.5.0,可以支持hadoop 0.17到0.20。貌似现在官网上已经没下载链接了,我放到附件供大家下载吧。
hive是依赖于hadoop的,所以安装hive之前请先装好hadoop,可以参看我的另一篇文章 hadoop的安装和使用。
将下载到的文件hive-0.5.0-bin.tar.gz解压到hadoop目录下,然后修改下环境变量 /etc/profile ,加上下面几行:
Shell代码
1.export HIVE_HOME=/data/hadoop/hive-0.5.0-bin
2.export PATH=$PATH:$HIVE_HOME/bin
3.export HADOOP_HOME=/data/hadoop
为了让刚设置的环境变量生效,需要退出终端,再重新登录。可以通过echo $HIVE_HOME命令查看,确保设置的环境变量已经生效。
好了,下面就可以使用hive了,hive用起来很简单,看下面的例子。
Shell代码
# hive
Hive history file=/tmp/root/hive_job_log_root_201106191843_199722387.txt
hive> show tables;
OK
Time taken: 10.09 seconds
hive> CREATE TABLE tt(id int,name string)
> ROW FORMAT DELIMITED
> FIELDS TE RMINATED BY ','
> STORED AS TEXTFILE;
OK
Time taken: 0.821 seconds
hive> show tables;
OK
tt
Time taken: 0.134 seconds
hive> select * from tt;
OK
Time taken: 0.245 seconds
hive> drop table tt;
OK
Time taken: 0.602 seconds
hive>
这个例子中,我们启动hive程序,新建了一个新表tt,然后做了一次查询,然后将表删除了。通过这种简单的类SQL命令,就可以进行复杂的分布式计算了,是不是感觉很爽呢。如果需要学习更复杂的操作,可以参看hive的帮助文件。