Hive语法(一)
文章目录
Hive数据类型
基本数据类型(与SQL类似)
集合数据类型
ARRAY:存储的数据为相同类型
MAP:具有相同类型的键值对
STRUCT:封装了一组字段
Hive数据结构
数据库操作
创建库
CREATE DATABASE [IF NOT EXISTS] database_name
[COMMENT database_comment]
[LOCATION hdfs_path]
[WITH DBPROPERTIES(property_name=property_value,..)]
COMMENT:数据库注释说明语句
LOCATION:指定数库在HDFS存储位置默认/user/hive/warehouse/dbname.db
WITH DBPROPERTIES:用于指定一些数庭库的属性配置。
使用库
选择特定的数据库
USE database_name
删除库
默认为RESTRICT-------这意味着仅在数据库为空时才删除它。
要删除带表数库(不为空数库)-----CASCADE强制删除
DROP DATABASE [IF EXISTS] database_name [RESTRICT|CASCADE]
表操作
创建表
CREATE TABLE [IF NOT EXISTS] [db_name].table_name
(col_name data_type [COMMENT col_comment],…)
[COMMENT table comment]
[ROW FORMAT DELIMITED ..]
指定分隔符
LazySimpleSerDe是Hive默认的,包含4种子语法,分别用于指定字段之间、集合元素之间、map映射kv之间、换行的分隔符号。
默认分隔符(可省略 row format)
建表时如果没有row format语法指定分隔符,则采用默认分隔符;
默认的分割符是’\001’,一种特殊的字符,使用的是ASC11编码的值,键盘是打不出来的。
在vim编辑器中,连续按下ctrl+v / ctrl+a即可输入’\001’,显示^A
在其他编辑器中以SOH的形式显示
删除表
drop table table_name
show语法
#查看数据库
show databases
#查看表
show tables
#查看指定某个数据库的表
show tables [in database_name]
#查看创建表信息
show create table table_name
案例
数据
Michael|Montreal,Toronto|Male,30|DB:80|Product:Developer Lead
Will|Montreal|Male,35|Perl:85|Product:Lead,Test:Lead
Shelley|New York|Female,27|Python:80|Test:Lead,COE:Architect
Lucy|Vancouver|Female,57|Sales:89,HR:94|Sales:Lead
建库
create database test;
建表
create table if not exists employee(
name string,
workplace array<string>,
gender_age struct<gender:string,age:int>,
skills_score map<string,int>,
depart_title map<string,string>
)
row format delimited fields terminated by '|'
collection items terminated by ','
map keys terminated by ':'
lines terminated by '\n';
上传数据
load data local inpath '/opt/stufile/emp.txt' into table employee;
查询结果
select * from employee;