hive进行mapreduce卡壳解决方法

最新推荐文章于 2022-03-01 21:08:07 发布

stpyx946

最新推荐文章于 2022-03-01 21:08:07 发布

阅读量3.4k

点赞数 1

分类专栏：大数据

本文链接：https://blog.csdn.net/stpyx946/article/details/51314233

版权

大数据专栏收录该内容

2 篇文章 0 订阅

订阅专栏

在google搜索得出的解决方案是在执行的hive语句前添加以下几条参数值设定语句：

set mapreduce.job.reduces=512;
set hive.groupby.skewindata=true;
set hive.optimize.skewjoin=true;
set hive.skewjoin.key=5000;
set hive.groupby.mapaggr.checkinterval=5000;

设置后，能保证hive语句正常完整执行，不会卡在固定的MapReduce进度上。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

stpyx946

关注关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
1
评论
hive进行mapreduce卡壳解决方法

hive进行mapreduce卡壳解决方法
复制链接

扫一扫

专栏目录

Hive mapreduce job报错解决

涵sir的博客

07-05

2107

问题描述：使用beeline连接hiveserver2，将HDFS上的json格式数据导入到一个临时表，然后再通过insert into ... select ...将数据导入正式表中，但在这一步Hive报错，Error信息为：ERROR : FAILED: Execution Error, return code 2 from org.apache.hadoop.hive.ql.exec.mr.MapRedTask 详细报错如下: INFO : Completed compiling command.

Hive使用中常见的问题及解决方法

LuciferLonelines的博客

12-08

1685

Hive使用中常见问题及解决方法

1 条评论您还未登录，请先登录后发表或查看评论

hive执行insert语句时，MapReduce进度一直是0%

07-16

5328

修改yarn-site.xml中的yarn.nodemanager.resource.memory-mb值大小(2G->4G) 原先设置 <property> <name>yarn.nodemanager.resource.memory-mb</name> <value>2048</value> <...

Hadoop运行mapreduce卡住或者一直停在map 0% reduce 0%的解决方案

家里没矿

10-20

2万+

首先先要说明我的系统的一个配置主机名主机IPV4地址配置 hadoop001 192.168.120.100 RecourceManager、NodeManager、DateNode、NameNode hadoop002 192.168.120.101 NodeManager、DateNode、SecondaryNameNode hadoop003 192.168.1...

用hive执行select查询，使用mapreduce离线查询就一直卡在这里，原来是yarn出了问题，两个节点都是standby！【已解决】

一个bug修一年的博客

01-23

891

求高人指点！！！

Hive 执行count聚合函数 insert 方法 map 0% reduce 0%

ZHappyDragon的博客

12-20

1403

Hive 执行count聚合函数 insert 方法 map 0% reduce 0% 报错截图大概就是stage-1 map=0% reduce=0% return code 2 .。。等等从里面的报错信息根本看不出什么，那我们就去看日志文件，在hadoop安装目录下的logs/userlogs文件夹里面，里面是这次任务的编号，它是暂时保存的，当hive被关闭时，这些文件已被删除了在logs/userlogs文件夹里面中，选择一个点进去看主要查看stderr文件我这里面报错的是错误:

hadoop+ha+hive+mapreduce

04-09

【Hive】Hive是基于Hadoop的数据仓库工具，它将SQL-like查询语言转换为MapReduce任务进行运行。Hive提供了数据整理、查询和分析的功能，使得非Java背景的分析师也能操作Hadoop集群。Hive通过元数据来定义表结构，...

hive的一些报错及解决方法

12-18

### Hive的一些报错及解决方法 #### 一、Hive连接报错在更换网络接口卡后重新启动服务时，可能会遇到Hive连接失败的问题。此类问题通常与元数据存储中的异常有关，例如存在多个版本的元数据或者端口被其他服务...

HDFS+MapReduce+Hive+HBase十分钟快速入门.zip_hbase_hdfs_hive_mapReduce

09-24

在大数据处理领域，Hadoop生态系统中的HDFS（Hadoop Distributed File System）、MapReduce、Hive和HBase是四个至关重要的组件。本资料“HDFS+MapReduce+Hive+HBase十分钟快速入门”旨在帮助初学者迅速理解这些技术...

BDP_Spark_Hive_MapReduce

02-20

标题“BDP_Spark_Hive_MapReduce”暗示了这是一个关于大数据处理技术的项目，主要涉及三个核心组件：Apache Spark、Apache Hive以及MapReduce。这些工具在大数据生态系统中扮演着重要角色，尤其在数据处理和分析方面...

大数据Hadoop、MapReduce、Hive项目实践

热门推荐

OopsOutOfMemory盛利的博客

11-21

2万+

一、引子今天在跑一段很复杂而且涉及数据量10年的N个表join的长SQL时，发生了OOM的异常。由于一个map通常配置只有64MB或者128MB，则在Map阶段出现OOM的情况很少见。所以一般发生在reduce阶段。但是今天这个异常详细的看后，会发现既不是map阶段，也不是reduce阶段，发现不是执行过程，而是driver提交job阶段就OOM了。Hive中XMLEncoder序列化Mapred

hive使用中的问题,优化,总结

weixin_42094092的博客

07-22

534

下面是几年来hive使用过程中的一些问题总结,可能随着版本升级这些问题都不是问题,写下来留个纪念数据倾斜解决：数据量大不怕，就怕数据倾斜 a. 从sql语句入手，优化语句 a1.尽量用分区过滤，减少数据量， a2.每个表单独用where过滤不需要的数据，再拉出数据集，不要将过滤条件放在最后或on后面（过滤条件放where后与inner join时等价，left join时影响很大）由于where 和join的的天然属性，需要遵循先过滤再join，勿先join再过滤 a3.过滤掉关联键，groupb

hive常见错误及解决方案

qqyang_的博客

07-15

3776

1）SecureCRT 7.3出现乱码或者删除不掉数据，免安装版的SecureCRT 卸载或者用虚拟机直接操作或者换安装版的SecureCRT 2）连接不上mysql数据库（1）导错驱动包，应该把mysql-connector-java-5.1.27-bin.jar导入/opt/module/hive/lib的不是这个包。错把mysql-connector-java-5.1.27.tar.gz导入hive/lib包下。（2）修改user表中的主机名称没有都修改为%，而是修改为localhost

HIVE:Hive分区排序报错

zuodingquan666的博客

12-19

2811

首先报错信息如下： Number of reduce tasks not specified. Estimated from input data size: 1 In order to change the average load for a reducer (in bytes): set hive.exec.reducers.bytes.per.reducer=<number> In order to limit the maximum number of reducers:

hive执行sql提交mapreduce任务无法加载队列

weixin_43487305的博客

02-06

942

hive执行sql提交mapreduce任务无法加载队列拒绝原因：YARN : Error assigning app to queue default 将应用程序分配到默认队列值时出错 Job Submission failed with exception ‘java.io.IOException(org.apache.hadoop.yarn.exceptions.YarnException: Failed to submit application_1612322768362_0044 to YAR

hive执行报错的解决方式--bug(1)

Diana的博客

06-05

2805

Query ID = 11102129_20190605160101_98bcf445-eea6-437a-9073-e2394663d618. Total jobs = 1. Launching Job 1 out of 1. Number of reduce tasks not specified. Estimated from input data size: 1099. In order...

hive之核心知识点（一）

Ghjkluuu的博客

03-01

616

1，hive关键点： hive是通过mysql语句进行处理数据，首先我们在客户端写sql语句，把写的sql语句的元数据信息加载到mysql中，mysql和hdfs映射的表结构进行交互，最后通过mapreducer进行处理，显示处理过后的信息，底层数据没有变化，只是把处理的数据显示出来，同样可以把处理过后的数据，保存起来，保存到hdfs底层硬件中，这样以来可以看出hive处理大数据的强大之处。 ...

Hive的mapreduce

06-09

Hive是一个基于Hadoop的数据仓库工具，它可以将SQL语句转化为MapReduce任务进行处理。在Hive中，每个SQL语句都会被转换为一个或多个MapReduce任务，具体的转换方式由Hive的执行引擎完成。在MapReduce任务执行过程中...