hive函数

最新推荐文章于 2024-07-06 23:27:11 发布

夏革

最新推荐文章于 2024-07-06 23:27:11 发布

阅读量242

点赞数

分类专栏： Hadoop

本文链接：https://blog.csdn.net/u011088579/article/details/79629530

版权

本文介绍了Hive中的复合数据类型，包括Structs、Maps和Arrays的使用方式，以及如何通过DOT和方括号进行存取。此外，讲解了explode函数将一行数据拆分为多行，concat_ws和collect_list函数在列转行中的应用。还讨论了array_contains和collect_set在检验集合元素和去重中的作用。Lateral View与UDTF结合使用，用于处理多行数据。最后提到了json数据处理函数get_json_object和json_tuple，以及Hive的窗口函数。

摘要由CSDN通过智能技术生成

复合数据类型

Structs： structs内部的数据可以通过DOT（.）来存取，例如，表中一列c的类型为STRUCT{a INT; b INT}，我们可以通过c.a来访问域a
Maps（K-V对）：访问指定域可以通过[“指定域名称”]进行，例如，一个Map M包含了一个group-》gid的kv对，gid的值可以通过M[‘group’]来获取
Arrays：array中的数据为相同类型，例如，假如array A中元素[‘a’,‘b’,‘c’]，则A[1]的值为’b’

类型	解释	举例
struct	与c++中的结构体类似，可通过‘.’访问每个域的值，比如Struct{first string,last string},可以通过name.first访问第一个成员	struct（‘john’，‘doe’）
map	存储key/value对，可通过[‘key’]获取每个key的值，比如‘first’–>‘john’ 可通过name[‘last’]获取last name。	map(‘first’,‘john’,last,‘doe’)
array	同种类型的数据集合，从0开始索引，比如[‘john’,‘doe’],可通过name[1]获取doe	array(‘john’,‘doe’)

行拆列 explode

explode 是一个 hive 内置的表生成函数：Built-in Table-Generating Functions (UDTF)，主要是解决 1 to N 的问题，即它可以把一行输入拆成多行，比如一个 array 的每个元素拆成一行，作为一个虚表输出

explode(ARRAY) 列表中的每个元素生成一行
explode(MAP) map中每个key-value对，生成一行，key为一列，value为一列

---word count例子
select word,count(1) num

最低0.47元/天解锁文章

夏革

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录