1. 建表
1.1 支持数据类型
整型:TINYINT,SMALLINT,INT,BIGINT
字符型:STRING,CHAR,VARCHAR
浮点型:FLOAT,DOUBLE,DECIMAL
时间:TIMESTAMP,DATE
布尔类型:BOOLEAN
字节型:BINARY
1.2 建表语句
create table a(
id decimal(18,2),
stamp string
)
row format delimited --Hive将HDFS上的文件映射表,指定分隔符区分列(比如’,’ ‘;’ or ‘^’ 等),序列化和反序列化
fields terminated by "\t" --默认是换行符
[COLLECTION ITEMS TERMINATED BY ‘-’]
[MAP KEYS TERMINATED BY ‘:’] --可选
stored as TEXTFILE; --file format 默认是TEXTFILE 可选RCFILE
根据类型可以选择是否进行其他的区分,如果字段是数组形式,通过 ‘-’ 进行分割,即COLLECTION ITEMS TERMINATED BY ‘-’、如果是键值对形式map,通过 ‘:’ 分割键值,即 MAP KEYS TERMINATED BY ‘:’;
说明:表类型分为内部表和外部表,内部表由hive管理,外部表由hdfs管理
其他建表方法
create table t1 as select * from t
create table t1 like t
特有的数据类型:
ARRAY:ARRAY类型是由一系列相同数据类型的元素组成,这些元素可以通过下标来访问。比如有一个ARRAY类型的变量fruits,它是由['apple','orange','mango']组成,那么我们可以通过fruits[1]来访问元素orange,因为ARRAY类型的下标是从0开始的;
MAP:MAP包含key->value键值对,可以通过key来访问元素。比如"userlist"是一个map类型,其中username是key,password是value;那么我们可以通过userlist['username']来得到这个用户对应的password;
STRUCT:STRUCT可以包含不同数据类型的元素。这些元素可以通过"点语法"的方式来得到所需要的元素,比如user是一个STRUCT类型,那么可以通过user.address得到这个用户的地址。
UNION: UNIONTYPE,他是从Hive 0.7.0开始支持的。
2. 增删改查
2.1 查询
select * from t1
2.2 插入
支持部分字段插入,在插入时需小写字段名
eg:insert into t1(id,name) select id,NAME from t
2.3 删除数据
truncate table t1
delete from t1
drop table t1
2.4 修改数据
对于更新数据,表应满足以下条件:
1. 表的存储格式必须是ORC(STORED AS ORC)
2. 表必须进行分桶(CLUSTERED BY (col_name, col_name, ...) INTO num_buckets BUCKETS)
3. Table property中参数transactional必须设定为True(tblproperties('transactional'='true'));
4. 需设置服务器端和客户端参数
参考网址:https://blog.csdn.net/xueyao0201/article/details/79387647
2.5 修改表字段
ALTER TABLE t1 CHANGE name ename string;
ALTER TABLE t1 RENAME TO t2
ALTER TABLE t1 ADD COLUMNS (sex string)
ALTER TABLE t1 DROP [COLUMN] name
参考网址:https://blog.csdn.net/helloxiaozhe/article/details/80749094