Hadoop Wordcount 一直卡在Job Running解决办法

在运行Hadoop Wordcount作业时遇到Job Running状态卡住的问题,通过检查YARN网页诊断发现等待AM容器分配和启动。解决方法包括在Security Group中开放30000-50000端口访问,以及调整mapred-site.xml中的配置参数,如`mapreduce.reduce.shuffle.memory.limit.percent`、`mapreduce.reduce.shuffle.input.buffer.percent`和`mapreduce.reduce.shuffle.parallelcopies`,以避免ShuffleError。经过调整,作业能够顺利进行。
摘要由CSDN通过智能技术生成

我使用的是腾讯云,4核8G的配置,hosts文件如下:

我没有对内存分配做设置,使用的都是默认的。

运行wordcount案例的时候总是卡住,查了一圈,有说把mapred-site.xml中

        <name>mapreduce.framework.name</name>
        <value>yarn</value>

这一条删除的,但是删除了相当于仅仅在本机上运行,就不是分布式了。

在yarn的网页上看到,卡在了waiting for AM container to be allocated, launched and register,Diagnostic说的是Container allocated,waiting to be launched.

持续等待,最后timeout 出错误,发现是连接不上 (我的)servant1:47867

我很奇怪,内部的通讯不是用8030-8032这几个吗,于是我看了启动集群的时候的nodemanager日志,发现在启动的时候会被分配一个新的Node ID,而通讯使用的也是这个ID,比如说下图,ID就是smenn-servant2:45181。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值