转载请注明~
在学习了Linux系统操作命令和shell编程之后,将进入到hive的学习中,先主要介绍hive的数据类型和文件格式。
01数据类型
基本数据类型
Hive 提供了基本数据类型和复杂数据类型
整型
TINYINT — 微整型,只占用1个字节,只能存储0-255的整数。
SMALLINT– 小整型,占用2个字节,存储范围–32768 到 32767。
INT– 整型,占用4个字节,存储范围-2147483648到2147483647。
BIGINT– 长整型,占用8个字节,存储范围-263到263-1。
布尔型
BOOLEAN — TRUE/FALSE
浮点型
FLOAT– 单精度浮点数。
DOUBLE– 双精度浮点数。
字符串型
STRING– 不设定长度。

image.png
复杂数据类型
Structs:一组由任意数据类型组成的结构。比如,定义一个字段C的类型为STRUCT {a INT; b STRING},则可以使用a和C.b来获取其中的元素值;
Maps:和Java中的Map相同,即存储K-V对的;
Arrays:数组;
本文介绍了Hive的数据类型,包括基本类型如整型、浮点型、字符串型和复杂类型如Structs、Maps、Arrays,以及新数据类型TIMESTAMP。还探讨了数据类型转换,包括显式和隐式转换,并讲解了Hive的不同文件格式,如TEXTFILE、SEQUENCEFILE、RCFILE、ORC和PARQUET,强调了列式存储的优势。最后对比了Hive与其他SQL的数据格式区别。
最低0.47元/天 解锁文章

2044

被折叠的 条评论
为什么被折叠?



