数据类型
Hive 中支持大多数的基本数据类型,和3个其他数据库中烧少有的集合数据类型。
基本数据类型包括 numeric, Boolean, string, timstamp等等.
复杂数据类型有: arrays,maps,structs。
见下表:

基本数据类型
Hive 的基本数据类型与 Java 的数据类型相合,即使一些名字是受了 Mysql 类型的名字的影响。
与Java中的对应关系:
| Hive | Java | 字节数 |
|---|---|---|
| INTYINT | byte | 1 |
| SMALLINT | short | 2 |
| INT | int | 4 |
| BIGINT | long | 8 |
| FLOAT | float | 32 bit |
| DOUBLE | double | 64 bit |
| STRING | String |
除此之外,DECIMAL 与 oracle 的 number 类型相似。默认长度为10位整数,最大允许长度为 38。
DECIMAL(10,4)
STRING 类型是一个没有长度限制的字符串(不过理论上是 2G),VARCHAR 与 CAHR 就不说了。
TIMESTAMP 存储的是纳秒精度的时间戳。可以使用 to_utc_timestamp 和 from_utc_timestamp 来与 DATE 类型互相转换。
集合数据类型
这里要说的是 UNION, 他可以存储由多个不同数据类型组成的集合。往集合中放入的数据必须与集合中的各个数据类型相匹配,且使用从1开始的标志选取相应的值。
数据转型

- 整型遵循小转大。可转成文本。
- 文本类型之间可以随意转换。
- 上面这些都可以转型为 DOUBLE 或者 DECIMAL。
- 布尔不能转成其他类型。
- TIMESTAMP 与 DATE 前文提到。
一个例子
create table complex (
c1 array<int>,
c2 map<string, int>,
c3 struct<a:string, b:int, c:double>
c4 uniontype<string, int>
);
查询的例子:
hive> select c1[0], c2['b'], c3.c, c4 from complex;
1 2 1.0 {1:63}
End!!
1万+

被折叠的 条评论
为什么被折叠?



