【Hive】Hive 数据类型

骑着蜗牛ひ追导弹'

已于 2022-08-25 14:32:25 修改

阅读量577

点赞数

分类专栏： # Hive 文章标签： hive

于 2020-12-25 23:49:00 首次发布

本文链接：https://blog.csdn.net/qq_45797116/article/details/111713222

版权

Hive 专栏收录该内容

7 篇文章 1 订阅

订阅专栏

文章目录

一、基本数据类型
二、集合数据类型
- 案例精讲：
三、类型转换

一、基本数据类型

在这里插入图片描述

对于Hive的String类型相当于数据库的varchar类型，该类型是一个可变的字符串，不过它不能声明其中最多能存储多少个字符，理论上它可以存储2GB的字符数。

返回顶部

二、集合数据类型

在这里插入图片描述

Hive 有三种复杂数据类型 ARRAY、MAP 和 STRUCT。ARRAY 和 MAP 与 Java 中的
Array 和 Map 类似，而 STRUCT 与 C 语言中的 Struct 类似，它封装了一个命名字段集合，
复杂数据类型允许任意层次的嵌套。

案例精讲：

1）假设某表有如下一行

{"name": "songsong","friends": ["bingbing" , "lili"],"children": { "xiao song": 18 ,"xiaoxiao song": 19} "address": {"street": "hui long guan" ,"city": "beijing"}}

我们用JSON格式来表示其数据结构。在Hive下访问的格式为:

{
    "name": "songsong",
    "friends": ["bingbing" , "lili"] , //列表Array, 
    "children": {                      //键值Map,
        "xiao song": 18 ,
        "xiaoxiao song": 19
    }
    "address": {                      //结构Struct,
        "street": "hui long guan" ,
        "city": "beijing" 
    }
}

2）基于上述数据结构，我们在Hive里创建对应的表，并导入数据。创建本地测试文件test.txt

songsong,bingbing_lili,xiao song:18_xiaoxiao song:19,hui long guan_beijing
yangyang,caicai_susu  ,xiao yang:18_xiaoxiao yang:19,chao yang_beijing

3）Hive上创建测试表test

create table test(
 name string,
 friends array<string>,             // 列表
 children map<string, int>,         // 键值
 address struct<street:string, city:string>  // 结构
)
row format delimited fields terminated by ','  // 字段分隔符
collection items terminated by '_'             // MAP STRUCT 和 ARRAY 的分隔符(数据分割符号)
map keys terminated by ':'                     // 键值分隔符
lines terminated by '\n';                      // 行分隔符

4）导入文本数据到测试表

hive (default)> load data local inpath ‘/opt/module/datas/test.txt’ into table test

5）访问三种集合列里的数据，以下分别是ARRAY，MAP，STRUCT的访问方式

hive (default)> select friends[1],children['xiao song'],address.city from test
where name="songsong";
OK
_c0     _c1     city
lili    18      beijing
Time taken: 0.076 seconds, Fetched: 1 row(s)

返回顶部

三、类型转换

Hive的原子数据类型是可以进行隐式转换的，类似于Java的类型转换，例如某表达式使用INT类型，TINYINT会自动转换为INT类型，但是Hive不会进行反向转化，例如，某表达式使用TINYINT类型，INT不会自动转换为TINYINT类型，它会返回错误，除非使用CAST操作。

1．隐式类型转换规则如下

（1）任何整数类型都可以隐式地转换为一个范围更广的类型，如TINYINT可以转换成INT，INT可以转换成BIGINT。
（2）所有整数类型、FLOAT和STRING类型都可以隐式地转换成DOUBLE。
（3）TINYINT、SMALLINT、INT都可以转换为FLOAT。
（4）BOOLEAN类型不可以转换为任何其它的类型。

2．可以使用CAST操作显示进行数据类型转换

例如：

CAST('1' AS INT)将把字符串’1’ 转换成整数1；如果强制类型转换失败，如执行CAST('X' AS INT)，表达式返回空值 NULL。

返回顶部

骑着蜗牛ひ追导弹'

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
【Hive】Hive 数据类型

文章目录一、基本数据类型二、集合数据类型案例精讲：三、类型转换一、基本数据类型对于Hive的String类型相当于数据库的varchar类型，该类型是一个可变的字符串，不过它不能声明其中最多能存储多少个字符，理论上它可以存储2GB的字符数。返回顶部二、集合数据类型Hive 有三种复杂数据类型 ARRAY、MAP 和 STRUCT。ARRAY 和 MAP 与 Java 中的Array 和 Map 类似，而 STRUCT 与 C 语言中的 Struct 类似，它封装了一个命名字段集..
复制链接

扫一扫