Hive是大数据开发培训当中,入门必须掌握的重要基础知识,作为Hadoop体系当中的数据仓库工具,在数据提取、转化、加载的环节当中,起到非常重要的支持作用。今天的大数据开发分享,我们就来讲讲Hive常用命令总结。
Hive作为数据仓库工具,其实质上提供的就是将SQL语句转换为MapReduce程序的一个操作,通过自己的SQL查询分析需要的内容,也被称之为Hive SQL。
Hive SQL与关系型数据库的SQL略有不同,但支持了绝大多数的语句如DDL、DML以及常见的聚合函数、连接查询、条件查询。
下面我们来具体认识一下Hive常用的命令——
1.Hive客户端登录
(1)Hive客户端访问Hive
Hive
(2)beeline访问Hive
beeline
beeline> !connect jdbc:hive2://bigdata5.zhenglihan.com:10000 hive hive org.apache.hive.jdbc.HiveDriver
(3)impala访问Hive(impala-shell中创建的表和beeline、Hive中创建的不能共存)
impala-shell
2.数据库操作
(1)查看所有数据库
show databases;
(2)选择数据库
use default;
(3)查看所有表
show tables;
(4)模糊匹配搜索表
show tables like'test*'
(5)创建表
CREATE TABLE default.testHive(
id STRING,
name STRING
)row format delimited
fields terminated by','
STORED AS TEXTFILE;
(6)从本地导入数据到Hive
load data local inpath'file:home/program/Hive/data/testHive.txt'overwrite into table default.testHive;
(7)从hdfs上导入数据到Hive
hadoop fs-put-f/home/program/Hive/data/testHive.txt/tmp/zhenglihan/cdhBigdata/Hive/testHive.txt
load data inpath'/tmp/zhenglihan/cdhBigdata/Hive/testHive.txt'overwrite into table default.testHive;
(8)查看表结构
desc default.testHive;
(9)查看表创建结构
show create table default.testHive;
(10)删除表
drop table default.testHive;
(11)创建外部表
CREATE external TABLE default.test_external_Hive(
id STRING,
name STRING
)row format delimited
fields terminated by',';
(12)删除外部表
drop table test_external_Hive;
(13)创建表并从其他表中导入数据
create table test_Hive_create_from_select as select*from default.testHive;
(14)从hdfs上导入数据到外部表
hadoop fs-put-f/home/program/Hive/data/testHive.txt/tmp/zhenglihan/cdhBigdata/Hive/testHive.txt
hadoop fs-cp/tmp/zhenglihan/cdhBigdata/Hive/testHive.txt/user/Hive/warehouse/test_external_Hive/
总结:
关于大数据开发,Hive常用命令总结,以上就为大家做了一个简单的入门介绍了。总体来说,Hive基本语法和MYSQL大同小异,如果本身有MySQL的基础,那么学习掌握Hive SQL也是手到擒来的事。