【Hive】Hive 一些面试题

最新推荐文章于 2024-04-26 18:40:55 发布

九师兄

最新推荐文章于 2024-04-26 18:40:55 发布

阅读量448

点赞数

分类专栏：大数据-hive 文章标签： hive hadoop mapreduce

本文为博主九师兄（QQ:541711153 欢迎来探讨技术）原创文章，未经允许博主不允许转载。

本文链接：https://blog.csdn.net/qq_21383435/article/details/125578516

版权

大数据-hive 专栏收录该内容

36 篇文章 462 订阅 ¥9.90 ¥99.00

订阅专栏

本文介绍了Hive在处理数据倾斜问题上的策略，如参数调节和SQL语句调整。同时，讲解了Hive的HSQL如何转化为MapReduce过程，以及Hive与数据库交互的原理。还涵盖了Hive的元数据存储方式、内部表与外部表的区别、压缩格式的比较以及UDF、UDAF和UDTF的区别，是Hive面试的必备知识点。

摘要由CSDN通过智能技术生成

在这里插入图片描述

1.概述

Hive 表关联查询，如何解决数据倾斜的问题？

1）倾斜原因： map 输出数据按 key Hash 的分配到 reduce 中，由于 key 分
布不均匀、业务数据本身的特、建表时考虑不周、等原因造成的 reduce 上的
数据量差异过大。
（ 1） key 分布不均匀;
（ 2）业务数据本身的特性;
（ 3）建表时考虑不周;
（ 4）某些 SQL 语句本身就有数据倾斜;
如何避免：对于 key 为空产生的数据倾斜，可以对其赋予一个随机值。

2）解决方案

（ 1）参数调节：

hive.map.aggr =

了解本专栏

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

九师兄 你的鼓励是我做大写作的动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。