java客户端查询hive很慢_Hive面试，如何优化查询效率！

最新推荐文章于 2023-12-19 22:54:42 发布

weixin_39564527

最新推荐文章于 2023-12-19 22:54:42 发布

阅读量1.2k

点赞数

文章标签： java客户端查询hive很慢

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39564527/article/details/114947631

版权

本文介绍了优化Hive查询效率的多种方法，包括开启Fetch Task以避免MapReduce作业，合并中间表减少重复JOIN，利用分区表和列式存储减少扫描，启用JVM重用和推测执行，合理设置reduce个数，开启并行执行，以及优化SQL查询语句等。通过这些技巧，可以显著提升Java客户端查询Hive的速度。

摘要由CSDN通过智能技术生成

1，开启FetchTask

一个简单的查询语句，是指一个没有函数、排序等功能的语句，当开启一个Fetch Task功能，就执行一个简单的查询语句不会生成MapRreduce作业，而是直接使用FetchTask，从hdfs文件系统中进行查询输出数据，从而提高效率。

设置的方式：

Hive.fetch.task.conversion 默认为minimal

修改配置文件hive-site.xml

hive.fetch.task.conversion

more

Some select queries can be converted to single FETCH task

minimizing latency.Currently the query should be single

sourced not having any subquery and should not have

any aggregations or distincts (which incurrs RS),

lateral views and joins.

1. minimal : SELECT STAR, FILTER on partition columns, LIMIT only

2. more : SELECT, FILTER, LIMIT only (+TABLESAMPLE, virtual columns)

或者当前session修改

hive> set hive.fetch.task.conversion=more;

执行SELECT id, money FROM m limit 10; 不走mr

2，合并中间表

一个日志文件中，

最低0.47元/天解锁文章

weixin_39564527

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
java客户端查询hive很慢_Hive面试，如何优化查询效率！

1，开启FetchTask一个简单的查询语句，是指一个没有函数、排序等功能的语句，当开启一个Fetch Task功能，就执行一个简单的查询语句不会生成MapRreduce作业，而是直接使用FetchTask，从hdfs文件系统中进行查询输出数据，从而提高效率。设置的方式：Hive.fetch.task.conversion默认为minimal修改配置文件hive-site.xmlhive.fet...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。