Hive 数据类型
1. 数据类型
对于Hive的String类型相当于数据库的varchar类型,该类型是一个可变的字符串,理论上它可以储存2GB的字符数。
Hive有三种复杂数据结构类型ARRAY、MAP和STRUCT。ARRAY和MAP与Java中的Array和Map类似,而STRUCT与c语言中的Struct类似,它封装了一个命名字段集合。复杂数据类型允许任一层次的嵌套
2. 类型转换
Hive的原子数据类型是可以进行隐式转换的,类似于java的类型转换,例如某表达式使用INT类型,TINYINT会自动转换为INT类型,但是Hive不会进行反向转换,例如,某表达式使用了TINYINT类型,INT不会自动转换为TINYINT类型,它会返回错误,除非使用CAST操作。
隐式类型转换的规则如下
- 任何整数类型都可以隐式地转换为一个更广的类型,如TINYINT可以转换为INT,INT可以转换为BIGINT。
- 所有整数类型、FLOAT和STRING类型都可以隐式地转换成DOUBLE。
- TINYINT、SMALINT、INT都可以转换成FLOAT
- BOOLEAN类型不可以转换为任何其他的类型
可以使用CAST操作显示数据类型转换。例如CAST(‘1’ AS INT)将字符串’1’转换为整数1;如果强制类型转换失败,如CAST(‘X’ AS INT),表达式返回空值NULL。