hive基本命令
创建表
导表
将需要用的数据表,先上传到hdfs上面
先在hdfs上面创建对应的文件夹用于存放表,一般为一个表需要一个文件夹路径,不建议一个文件夹内同时存在多个表的情况。
hdfs dfs -mkdir /test/data/emp;
然后把文件上传到对应的文件夹内
hdfs dfs -put employee.txt /test/data/emp/
这样我们就准备好了一个表
用hive创建表
标准格式
直接输入建表语句
create external table employee(
name string,
address array<string>,
genderAndAge struct<gender:string,age:int>,
jobAndSalary map<string,int>,
depAndLvl map<string,string>
)
row format delimited
fields terminated by '|'
collection items terminated by ','
map keys terminated by ':'
lines terminated by '\n'
stored as textfile
location '/test/data/emp';
csv格式
create table employee (
name string,
address array<string>,
genderAndAge struct<gender:string,age:int>,
jobAndSalary map<string,int>,
depAndLvl map<string,string>
)
row format SerDe
"org.apache.hadoop.hive.serde2.OpenCSVSerde"
with serdeproperties(
"separatorChar"=",",
"quoteChar"="\"",
"escapeChar"="\\"
)
stored as TextFile
location "/test/data/emp";
CTAS格式
CTAS不能创建partition(分区表), external(外部表), bucket table(分桶表,一个分桶一个reduce)
只是在原表的基础上生成一个临时表,方便查询统计使用
create table employee_tmp
as select
name,
address,
genderAndAge,
jobAndSalary,
depAndLvl
from employee
CTE格式(CTAS with Common Table Expression)
CREATE TABLE cte_employee AS
WITH
r1 AS (SELECT name FROM r2 WHERE name = 'Michael'),
r2 AS (SELECT name FROM employee WHERE sex_age.sex= 'Male'),
r3 AS (SELECT name FROM employee WHERE sex_age.sex= 'Female')
SELECT * FROM r1 UNION ALL SELECT * FROM r3;
LIKE
like只能复制表的结构,并不会复制表内的数据
CREATE TABLE employee_like LIKE employee;
临时表
表只对当前session有效,session退出后自动删除
表空间位于/tmp/hive-<user_name>(安全考虑)
如果创建的临时表表名已存在,实际用的是临时表
create temporary table 表名
当退出hive的时候,临时表就不存在了
查询
Hive中map查询select map名[“字段名”] from 表名
HIve中数组查询 select 数组名[0|1|2] from 表名
Hive中Struct查询 select 类名.属性名 from 表名
其他的和MySQL中的一样
删除
只能删除表,不能删除单个记录
delete table 表名
清空表数据
truncate table 表名