full join 同名的字段怎么输出_【每日一题】说一下Hive怎么优化？（腾讯）

最新推荐文章于 2023-11-06 22:14:03 发布

程铭夜

最新推荐文章于 2023-11-06 22:14:03 发布

阅读量274

点赞数

文章标签： full join 同名的字段怎么输出

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42563415/article/details/112089028

版权

本文探讨了Hive的性能优化方法，包括MapJoin优化、行列过滤、分桶与分区技术、合理设置Map和Reduce数，以及小文件合并。通过调整参数和策略，可以提高Hive查询效率并减少资源浪费。

摘要由CSDN通过智能技术生成

勾叔今日带来腾讯面试题：说一下Hive怎么优化？

遇到这个问题，怎么作答？下面这些要点大家可以收藏下。

01. 问题分析

这个考察对Hive的深入的理解，直接说明Hive如何优化就可以。

02. 核心问题回答

a)MapJoin

如果不指定MapJoin或者不符合MapJoin的条件，那么Hive解析器会将Join操作转换成Common Join，

即：在Reduce阶段完成Join。容易发生数据倾斜。可以用MapJoin把小表全部加载到内存在map端进行Join，避免Reducer处理。

b)行列过滤

列处理：在SELECT中，只拿需要的列，如果有，尽量使用分区过滤，少用SELECT *。

行处理：在分区剪裁中，当使用外关联时，如果将副表的过滤条件写在Where后面，那么就会先全表关联，之后再过滤。

c)采用分桶技术

d)采用分区技术

e)合理设置Map数

通常情况下，作业会通过Input的目录产生一个或者多个Map任务。

主要的决

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。