Hive安装环境准备
Hive安装地址
Hive官网地址
:http://hive.apache.org/
文档查看地址
:https://cwiki.apache.org/confluence/display/Hive/GettingStarted
下载地址
:http://archive.apache.org/dist/hive/
github地址
:https://github.com/apache/hive
Hive安装部署
Hive安装及配置
- 把apache-hive-1.2.1-bin.tar.gz上传到linux的/opt/software目录下
- 解压apache-hive-1.2.1-bin.tar.gz到/opt/module/目录下面
- [luo@hadoop102 software]$ tar -zxvf apache-hive-1.2.1-bin.tar.gz -C /opt/module/
- 修改apache-hive-1.2.1-bin.tar.gz的名称为hive
- [luo@hadoop102 module]$ mv apache-hive-1.2.1-bin/ hive
- 修改/opt/module/hive/conf目录下的hive-env.sh.template名称为hive-env.sh
- [luo@hadoop102 conf]$ mv hive-env.sh.template hive-env.sh
- 配置hive-env.sh文件
- 配置HADOOP_HOME路径:export HADOOP_HOME=/opt/module/hadoop-2.7.2
- 配置HIVE_CONF_DIR路径:export HIVE_CONF_DIR=/opt/module/hive/conf
Hive集群配置
- 必须启动hdfs和yarn
- [luo@hadoop102 hadoop-2.7.2]$ sbin/start-dfs.sh
- [luo@hadoop103 hadoop-2.7.2]$ sbin/start-yarn.sh
- 在HDFS上创建/tmp和/user/hive/warehouse两个目录并修改他们的同组权限可写
- [luo@hadoop102 hadoop-2.7.2]$ bin/hadoop fs -mkdir /tmp
- [luo@hadoop102 hadoop-2.7.2]$ bin/hadoop fs -mkdir -p /user/hive/warehouse
[luo@hadoop102 hadoop-2.7.2]$ bin/hadoop fs -chmod g+w /tmp
[luo@hadoop102 hadoop-2.7.2]$ bin/hadoop fs -chmod g+w /user/hive/warehouse
Hive基本操作
- 启动hive:
[luo@hadoop102 hive]$ bin/hive
- 查看数据库:
hive>show databases;
- 打开默认数据库:
hive>use default;
- 显示default数据库中的表:
hive>show tables;
- 创建一张表:
hive> create table student(id int, name string);
- 显示数据库中有几张表:
hive>show tables;
- 查看表的结构:
hive>desc student;
- 向表中插入数据:
hive> insert into student values(1000,"ss");
- 查询表中数据:
hive> select * from student;
- 退出hive:
hive> quit;
将本地文件导入Hive实例
需求:将本地/opt/module/datas/student.txt这个目录下的数据导入到hive的student(id int, name string)表中。
数据准备
在/opt/module/datas/student.txt这个目录下准备数据
在/opt/module/目录下创建datas
- [luo@hadoop102 module]$ mkdir datas
在/opt/module/datas/目录下创建student.txt文件并添加数据
- [luo@hadoop102 module]