文章目录
Hive安装与客户端命令
Hive 基本概念
Hive:由 Facebook 开源用于解决海量结构化日志的数据统计。
Hive 是基于 Hadoop 的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并
提供类 SQL 查询功能。
本质是:将 HQL 转化成 MapReduce 程序
Hive 安装
1.Hive 官网地址 http://hive.apache.org/
2.文档查看地址 https://cwiki.apache.org/confluence/display/Hive/GettingStarted
3.下载地址 http://archive.apache.org/dist/hive/
4.github 地址 https://github.com/apache/hive
Hive 安装及配置
(1)把 apache-hive-1.2.1-bin.tar.gz 上传到 linux 的/opt/software 目录下
(2)解压 apache-hive-1.2.1-bin.tar.gz 到/opt/module/目录下面
tar -zxvf apache-hive-1.2.1-bin.tar.gz -C /opt/module/
(3)修改 apache-hive-1.2.1-bin.tar.gz 的名称为 hive
mv apache-hive-1.2.1-bin/ hive
(4)修改/opt/module/hive/conf 目录下的 hive-env.sh.template 名称为 hive-env.sh [ityouxin@hadoop102 conf]$ mv hive-env.sh.template hive-env.sh
(5)配置 hive-env.sh 文件
(a)配置 HADOOP_HOME 路径
export HADOOP_HOME=/opt/module/hadoop-2.7.2
(b)配置 HIVE_CONF_DIR 路径
export HIVE_CONF_DIR=/opt/module/hive/conf
Hadoop 集群配置
1、必须启动 hdfs 和 yarn
sbin/start-dfs.sh
sbin/start-yarn.sh
(2)在 HDFS 上创建/tmp 和/user/hive/warehouse 两个目录并修改他们的同组权限可写
bin/hadoop fs -mkdir /tmp
bin/hadoop fs -mkdir -p /user/hive/warehouse
bin/hadoop fs -chmod g+w /tmp
bin/hadoop fs -chmod g+w /user/hive/warehouse
(3)Hive 基本操作
(1)启动 hive [ityouxin@hadoop102 hive]$ bin/hive
(2)查看数据库 hive> show databases;
(3)打开默认数据库 hive> use default;
(4)显示 default 数据库中的表 hive> show tables;
(5)创建一张表 hive> create table student(id int, name string);
(6)显示数据库中有几张表 hive> show tables;
(7)查看表的结构 hive> desc student;
(8)向表中插入数据 hive> insert into student values(1000,“ss”);
(9)查询表中数据 hive> select * from student;
(10)退出 hive hive> quit;