Hive
1.定义:
Apache Hive 数据仓库软件便于读,写,和管理大型数据集驻留在分布式存储(Hadoop)使用SQL。
结构可以投影到存储中的数据上。
客户端的连接方式可采用:command line 和 JDBC Driver
注意:Hive实质就是客户端,不存在主从结构,搭建过程没有集群概念;
2.搭建Hive
前提:
a.Hadoop集群搭建完成!
b.start-dfs.sh开启HDFS
start-yarn.sh开启yarn
1.安装java(省略)
2.安装Hadoop(省略)
3.安装hive
$>cp /mnt/hgfs/download/apache-hive/apache-hive-1.2.1-bin.tar.gz ~/soft/
$>tar -zxvf apache-hive-1.2.1-bin.tar.gz
$>ln -s apache-hive-1.2.1-bin hive
配置环境变量:
【~/.bash_profile】
配置环境变量:
#hive install
export HIVE_HOME=/home/hyxy/soft/hive
export PATH=$HIVE_HOME/bin:$PATH
生效:
$>source .bash_profile
4.开启集群相关服务:
$>zkServer.sh start
$>start-all.sh
5.进入Hive
$>hive
6.测试:
hive>show databases;
hive>use default;
hive>show tables;
hive>create table text(id int ,name String);
hive>insert into text values(1,'zhangsan');
hive>select * from text;
hive>drop table text;
此时,Hive的安装已经结束了,测试hive的话,可参照我写的第6点!!!