数据类型
在创建表的时候我们在新建列的时候会需要指定数据类型,一般在数据文件中我们可以将所有的数据都指定为string即字符串类型,然后再用函数转换为其他的数据类型,比如日期、数值等。CREATE TABLE [IF NOT EXISTS] [db_name.]table_name
``[(col_name data_type [COMMENT col_comment], ... [constraint_specification])]
data_type
: primitive_type
| array_type
| map_type
| struct_type
| union_type复制代码
由hive的语法规则可以看到hive的数据类型大致可以分为5种,但是这5种又大致可以分为2类,第一类就是我们说的原始数据类型,或者说是基本数据类型,另外一类我们统称为复杂数据结构,我们下一节学习
数值类型类型占用字节数存储范围默认类型例子备注TINYINT1字节-128 to 127INT 类型0有符号整型
SMALLINT2字节-32,768 to 32,767INT 类型0有符号整型
INT4字节-2,147,483,648 to 2,147,483,647INT 类型0有符号整型
BIGINT8字节-9,223,372,036,854,775,808 to 9,223,372,036,854,775,807INT 类型0有符号整型
FLOAT4字节DOUBLE 类型有符号单精度浮点数
DOUBLE8字节DOUBLE 类型有符号双精度浮点数
DECIMAL--可带小数的精确数字字符串 Hive 0.11.0版本可用
NUMERIC和DECIMAL一样,Hive 3.0.0版本可用
需要注意的是所有的这些数据类型都是对Java中的接口的实现,因此这些类型的具体行为细节和Java中对应的类型是完全一致的。例如,STRING类型实现的是Java中的String,FLOAT实现的是Java中的float,等等
整型
其中整型类型包括(TINYINT, SMALLINT, INT/INTEGER, BIGINT),默认是INT 类型,也就是说一般情况下当你将整型数字存储Hive 表中的整型类型(TINYINT, SMALLINT, INT/INTEGER, BIGINT)的字段的时候,它所采用的的数据类型就是INT,而不是取决于你采用的到底是整型类型中的某一种,例如TINYINT和BIGINT
只有当你存入的数字超出了INT 类型的限制,它才可能采取你定义的BIGINT类型,或者你存储数据的时候强制指定了数据的类型,怎么强制指定呢,通过添加后缀的方式T