Hive函数面试高频考点

最新推荐文章于 2022-05-10 12:47:56 发布

日月交辉

最新推荐文章于 2022-05-10 12:47:56 发布

阅读量173

点赞数

分类专栏： Hive 数仓文章标签： hive

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_45705483/article/details/110356176

版权

数仓同时被 2 个专栏收录

6 篇文章 0 订阅

订阅专栏

5 篇文章 0 订阅

订阅专栏

目录

窗口函数/开窗函数

行转列

collect_set() --行转列，去重。不同行转为一个集合，可按序号取值

collect_list() --行转列，不去重。

concat()

concat_ws()

列转行

explode (array):返回多行array中对应的元素。如explode(array('A','B','C'))

explode(map):返回多行map键值对对应元素。如explode(map(1,'A',2,'B',3,'C'))

lateral view explode(split(col1,','))

--同组同列的数据拆分成多行，以sep分隔符区分

LATERAL VIEW：

1.Lateral View 用于和UDTF函数【explode,split】结合来使用。
2.首先通过UDTF函数将数据拆分成多行，再将多行结果组合成一个支持别名的虚拟表。
3..主要解决在select使用UDTF做查询的过程中查询只能包含单个UDTF，不能包含其它字段以及多个UDTF的情况。
4.语法：LATERAL VIEW udtf(expression) tableAlias AS columnAlias (',' columnAlias)

使用LATERAL VIEW + explode 函数进行查询，语句如下：

select movie,category_name

from movie_info

LATERAL VIEW explode(category) tmpTable as category_name;

-- category_name 是给 explode(category) 列起的别名

排序函数

rank() over(partition by .. order by .)

--根据partition排序，相同值，序号相同，序号跳跃

dense_rank() over(partition by .. order by ..)

--根据partition排序，相同值，序号相同，序号不跳跃

row_number() over(partitiion by .. order by .. )

--根据partition排序，相同值，序号不同，序号不跳跃

日期函数

date_format() --日期格式化

to_date(string timestamp) --返回时间字符串中的日期部分

current_date() --返回当前日期

date_add() & date_sub() --加减日期

next_day() --取当前天的下个周一，用作周指标

last_day() --取当月最后一天

date_add(next_day('2019-02-12','MO'),-7) --取当前周的周一

get_json_object解析json函数

nvl(value,default_value) - Returns default value if value is null else returns value

四个By区别

1.Order by：全局排序，只有一个Reduce
2.Sort By：分区内排序
3.Distrbute By：类似MR中Partition，进行分区，结合Sort By使用。
4.Cluster By：当Distrbute By 和Sort By字段相同时候使用，但是排序只能是升序排列，不能指定排序规则为asc或者desc。

窗口函数/开窗函数

OVER()

用于指定分析函数工作时的数据窗口大小，这个数据窗口大小可能会随着行的变而变化；

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

日月交辉 CSDN认证博客专家 CSDN认证企业博客

码龄5年

30: 原创

16万+: 周排名

11万+: 总排名

2万+: 访问

: 等级

446: 积分

78: 粉丝

106: 获赞

7: 评论

75: 收藏

私信

关注

热门文章

分类专栏

mysql-sql 4篇
mysql 9篇
Hive 5篇
总结自己
HiveQL 4篇
Hadoop 1篇
数仓DW 2篇
数仓 6篇
group by 1篇
mysql连接查询

最新评论

mysql-sql练习-5-行列互转
CSDN-Ada助手: MySQL入门技能树或许可以帮到你：https://edu.csdn.net/skill/mysql?utm_source=AI_act_mysql
mysql-sql练习-5-行列互转
普通网友: 文章结构严谨有条,层次分明,读起来一点也不费劲，让人受益匪浅。【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
Hive-HiveQL练习题
CSDN-Ada助手: 恭喜您写了第19篇博客！标题“Hive-HiveQL练习题”听起来非常有趣。您在这个主题上的持续创作让人印象深刻。如果我可以提一个建议的话，那就是在未来的博客中，或许可以考虑分享一些实际案例或者提供更多的示例代码，这样读者可以更好地理解和运用Hive-HiveQL。希望您能继续保持创作，并且期待看到更多精彩的内容！
Hive-函数总结
CSDN-Ada助手: 恭喜您撰写第20篇博客！我对您在"Hive-函数总结"这个主题上的持续创作表示钦佩。您的文章对于理解Hive函数的概念和应用非常有帮助。接下来，我希望您能在未来的博客中探索更多与Hive相关的话题，比如如何优化Hive查询性能或者与其他大数据工具的整合。期待您继续以谦虚的态度分享您的知识和经验！
Hive数据倾斜
CSDN-Ada助手: 推荐 MySQL入门技能树：https://edu.csdn.net/skill/mysql?utm_source=AI_act_mysql

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。