hive-调优笔记：JVM重用，并行执行、调整reducer个数的用处

最新推荐文章于 2023-08-11 14:44:49 发布

滑过的板砖

最新推荐文章于 2023-08-11 14:44:49 发布

阅读量1.6k

点赞数 1

分类专栏： Hive

Hive 专栏收录该内容

5 篇文章 0 订阅

订阅专栏

1、JVM重用是hadoop调优参数的内容，对hive的性能具有非常大的影响，特别是对于很难避免小文件的场景或者task特别多的场景，这类场景大多数执行时间都很短。hadoop默认配置是使用派生JVM来执行map和 reduce任务的，这是jvm的启动过程可能会造成相当大的开销，尤其是执行的job包含有成千上万个task任务的情况。

JVM重用可以使得JVM实例在同一个JOB中重新使用N次，N的值可以在Hadoop的mapre-site.xml文件中进行设置

mapred.job.reuse.jvm.num.tasks

也可在hive的执行设置：

set mapred.job.reuse.jvm.num.tasks=10;

JVM的一个缺点是，开启JVM重用将会一直占用使用到的task插槽，以便进行重用，直到任务完成后才能释放。如果某个“不平衡“的job中有几个 reduce task 执行的时间要比其他reduce task消耗的时间多得多的话，那么保留的插槽就会一直空闲着却无法被其他的job使用，直到所有的task都结束了才会释放。

2、并行执行，意思是同步执行hive的多个阶段，hive在执行过程，将一个查询转化成一个或者多个阶段。某个特定的job可能包含众多的阶段，而这些阶段可能并非完全相互依赖的，也就是说可以并行执行的，这样可能使得整个job的执行时间缩短

hive执行开启：set hive.exec.parallel=true

3、调整reducer个数：

设置 hive.exec.reducers.bytes.per.reducer（默认为1GB），受hive.exec.reducers.max（默认为999）影响：

mapred.reduce.tasks = min ( 参数2，总输入数据量/参数1 )

滑过的板砖

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

滑过的板砖 CSDN认证博客专家 CSDN认证企业博客

码龄14年

36: 原创

20万+: 周排名

133万+: 总排名

12万+: 访问

: 等级

1662: 积分

8: 粉丝

10: 获赞

3: 评论

10: 收藏

私信

关注

热门文章

分类专栏

个人知识积累
Hbase 16篇
Hadoop 1篇
Hive 5篇
Kafka 2篇
Solr 6篇
Storm
Zookeeper 3篇
Azkaban 5篇
Intellij 3篇
GitHub 2篇
Eclipse 4篇
Ganglia 1篇
Linux 3篇
Maven 1篇
Mongodb 2篇
Mysql
Oracle 1篇
Nagios 1篇
Nutch 3篇
Scala
Tomcat 3篇
JAVA 6篇
SVN 1篇
JavaScript 4篇
Redis 7篇
Python 2篇

最新评论

solr更新schema.xml后，重新把配置文件注入到zookeeper
吴伟楠回复 wangenpeng92: https://blog.csdn.net/b_evan/article/details/79743382 这是我写的一篇文章，里面有说明。其实就是配置tomcat（solr节点）和zookeeper给关联起来，具体怎么配我上面的文章有。
solr更新schema.xml后，重新把配置文件注入到zookeeper
wangenpeng92: 博主你好，最近我也在做solr集群，我想我们应该遇见了同样的问题，就是本地更改schema.xml之后，重启服务器之后并没有起作用，我也是尝试了好久才发现需要更新到zk之上，这是不是也说明了solr服务是从zk中读取的配置，而并不是solrhome中，但是博主知道他们是如何关联的吗？如果知道请告知我一下。
(冲突)十大Intellij IDEA快捷键
Mr's zhao: 并没有 !其智能程度令人瞠目结舌，有的功能eclispe 比他强,不要把它说的那么神

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。