1. 基本数据类型
新增数据类型TIMESTAMP的值可以是:
• 整数:距离Unix新纪元时间(1970年1月1日,午夜12点)的秒数
• 浮点数:距离Unix新纪元时间的秒数,精确到纳秒(小数点后保留9位数)
• 字符串:JDBC所约定的时间字符串格式,格式为:YYYY-MM-DD hh:mm:ss:fffffffff
BINARY数据类型用于存储变长的二进制数据。
2.复杂数据类型
3.数据类型应用举例
##创建员工表,使用默认分割符
CREATE TABLE employee(
name STRING,
salary FLOAT,
leader ARRAY,
deductions MAP,
address STRUCT
)
4.列的分割符
HiveQL文本文件数据编码表
CREATE TABLE employee(
name STRING,
salary FLOAT,
subordinates ARRAY,
deductions MAP,
address STRUCT
)
ROW FORMAT DELIMITED
FIELDS TERMINATED BY '\001'
COLLECTION ITEMS TERMINATED BY '\002'
MAP KEYS TERMINATED BY '\003'
LINES TERMINATED BY '\n'
STORED AS TEXTFILE;
• [ROW FORMAT DELIMITED]关键字,是用来设置创建的表在加载数据的时候,支持的列分隔符;
• FIELDS TERMINATED BY '\001' ,字符\001是^A的八进制数。这个子句表明Hive将使用^A字符作为列分隔符。
• COLLECTION ITEMS TERMINATED BY '\002'
,字符\002是^B的八进制数。这个子句表明Hive将使用^B字符作为集合元素的分隔符。
• MAP KEYS TERMINATED BY '\003'
,字符\003是^C的八进制数。这个子句表明Hive将使用^C字符作为map的键和值之间的分隔符。
• LINES TERMINATED BY '\n' 、STORED AS TEXTFILE这个两个子句不需要ROW FORMAT DELIMITED
关键字
• Hive目前对于LINES TERMINATED BY…仅支持字符‘\n’,行与行之间的分隔符只能为‘\n’。
hive的基本命令
1.数据库的创建:
<