hive的安装与使用

最新推荐文章于 2023-07-31 23:17:40 发布

rockecsn

最新推荐文章于 2023-07-31 23:17:40 发布

阅读量131

点赞数

分类专栏： Hive 文章标签：大数据 shell

本文链接：https://blog.csdn.net/rockecsn/article/details/84242240

版权

Hive 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

HadoopSQLApache.

hive的安装非常简单。官方下载地址是：http://hive.apache.org。hive目前最新版本是0.7.0，支持Hadoop 0.20.1 及 0.20.2，由于我这里hadoop的版本是0.19.2，所以我就只能用之前的版本了。我使用的版本是0.5.0，可以支持hadoop 0.17到0.20。貌似现在官网上已经没下载链接了，我放到附件供大家下载吧。

hive是依赖于hadoop的，所以安装hive之前请先装好hadoop，可以参看我的另一篇文章 hadoop的安装和使用。
将下载到的文件hive-0.5.0-bin.tar.gz解压到hadoop目录下，然后修改下环境变量 /etc/profile ，加上下面几行：

Shell代码
1.export HIVE_HOME=/data/hadoop/hive-0.5.0-bin
2.export PATH=$PATH:$HIVE_HOME/bin
3.export HADOOP_HOME=/data/hadoop

为了让刚设置的环境变量生效，需要退出终端，再重新登录。可以通过echo $HIVE_HOME命令查看，确保设置的环境变量已经生效。
好了，下面就可以使用hive了，hive用起来很简单，看下面的例子。

Shell代码
# hive
Hive history file=/tmp/root/hive_job_log_root_201106191843_199722387.txt
hive> show tables;
OK
Time taken: 10.09 seconds
hive> CREATE TABLE tt(id int,name string)
> ROW FORMAT DELIMITED
> FIELDS TE RMINATED BY ','
> STORED AS TEXTFILE;
OK
Time taken: 0.821 seconds
hive> show tables;
OK
tt
Time taken: 0.134 seconds
hive> select * from tt;
OK
Time taken: 0.245 seconds
hive> drop table tt;
OK
Time taken: 0.602 seconds
hive>

这个例子中，我们启动hive程序，新建了一个新表tt，然后做了一次查询，然后将表删除了。通过这种简单的类SQL命令，就可以进行复杂的分布式计算了，是不是感觉很爽呢。如果需要学习更复杂的操作，可以参看hive的帮助文件。