Hive性能调优之推测执行

最新推荐文章于 2020-08-25 10:04:07 发布

寒暄

最新推荐文章于 2020-08-25 10:04:07 发布

阅读量1k

点赞数

分类专栏： # ---Hive 文章标签： hive 数据仓库

本文链接：https://blog.csdn.net/qq_41106844/article/details/107429418

版权

---Hive 专栏收录该内容

20 篇文章 3 订阅

订阅专栏

在作业执行的过程中数据倾斜发生的可能性是很大的，甚至有可能只有一个task执行到50%，但是其他task早早执行完毕了。
这就需要推测执行，hadoop的推测执行机制会给这些有可能需要长时间才可以执行完的task准备一个备份，一旦task执行缓慢，那么备份task也会执行task的工作，看哪个先执行完就使用哪个的结果。
但是如果数据量过于庞大，备份task有可能直接打垮集群。

<property>
	<name>hive.mapred.reduce.tasks.speculative.execution</name>
	<value>true</value>
 	<description>
 		<!--是否启用还原器的推测执行。-->
 		Whether speculative execution for reducers shouldbe turned on.
 	</description>
</property>

优惠劵

寒暄

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
Hive性能调优之推测执行

在作业执行的过程中数据倾斜发生的可能性是很大的，甚至有可能只有一个task执行到50%，但是其他task早早执行完毕了。这就需要推测执行，hadoop的推测执行机制会给这些有可能需要长时间才可以执行完的task准备一个备份，一旦task执行缓慢，那么备份task也会执行task的工作，看哪个先执行完就使用哪个的结果。但是如果数据量过于庞大，备份task有可能直接打垮集群。<property> <name>hive.mapred.reduce.tasks.speculative
复制链接

扫一扫