Hive常用的复杂数据类型包括ARRAY,MAP,STRUCT,UNION,这些复杂类型是由基础类型组成的。
ARRAY:ARRAY类型是由一系列相同数据类型的元素组成,这些元素可以通过下标来访问。比如有一个ARRAY类型的变量fruits,它是由['apple','orange','mango']组成,那么我们可以通过fruits[1]来访问元素orange,因为ARRAY类型的下标是从0开始的;
MAP:MAP包含key->value键值对,可以通过key来访问元素。比如”userlist”是一个map类型,其中username是key,password是value;那么我们可以通过userlist['username']来得到这个用户对应的password;
STRUCT:STRUCT可以包含不同数据类型的元素。这些元素可以通过”点语法”的方式来得到所需要的元素,比如user是一个STRUCT类型,那么可以通过user.address得到这个用户的地址。
ARRAY:
Hive建表:
drop table if exists table_array;
CREATE TABLE IF NOT EXISTS table_array
(name String,
score array<float>
)
ROW FORMAT DELIMITED FIELDS TERMINATED BY'\t'
collection items terminated by '|'
stored as textfile;
新建一个array.txt,内容为xiaoming 90|95|100
使用load命令将文件加载到hive表:load data local inpath 'array.txt' into table table_array;
查看一下内容
MAP:
Hive建表:
drop table if exists table_map;
CREATE TABLE IF NOT EXISTS table_map
(name String,
times map<string,string>
)
ROW FORMAT DELIMITED FIELDS TERMINATED BY'\t'
collection items terminated by","
map keys terminated by ":"
stored as textfile;
新建一个mao.txt,内容为xiaoming ABC:2016-05,EFG:2016-09
使用load命令将文件加载到hive表:load data local inpath 'map.txt' into table table_map;
查看一下内容:
STRUCT:
Hive建表:
drop table if exists table_structs;
CREATE TABLE IF NOT EXISTS table_structs
(name string,
info struct<number:int,score:float>
)
ROW FORMAT DELIMITED FIELDS TERMINATED BY'\t'
collection items terminated by":"
stored as textfile;
新建一个struct.txt,内容为ABC 1254:7.4
使用load命令将文件加载到hive表:load data local inpath 'struct.txt' into table table_structs;
查看内容:
关于hive的复杂数据类型就介绍到这里,下篇介绍hive的内部表和外部表。