org.apache.hadoop.ipc.Client: Retrying connect to server: localhost/127.0.0.1:7359. Already tried 7

错误 :

org.apache.hadoop.ipc.Client: Retrying connect to server: localhost/127.0.0.1:7359. Already tried 7 time(s); retry policy is RetryUpToMaximumCountWithFixedSleep



2016-11-25 10:25:24,934 INFO org.apache.hadoop.yarn.server.resourcemanager.rmapp.attempt.RMAppAttemptImpl: appattempt_1479988153262_0002_000001 State change from SCHEDULED to ALLOCATED_SAVING

2016-11-25 10:25:24,934 INFO org.apache.hadoop.yarn.server.resourcemanager.rmapp.attempt.RMAppAttemptImpl: appattempt_1479988153262_0002_000001 State change from ALLOCATED_SAVING to ALLOCATED

2016-11-25 10:25:24,935 INFO org.apache.hadoop.yarn.server.resourcemanager.amlauncher.AMLauncher: Launching masterappattempt_1479988153262_0002_000001

2016-11-25 10:25:24,937 INFO org.apache.hadoop.yarn.server.resourcemanager.amlauncher.AMLauncher: Setting up container Container: [ContainerId: container_1479988153262_0002_01_000001, NodeId: localhost:7359, NodeHttpAddress: localhost:8042, Resource: <memory:2048, vCores:1>, Priority: 0, Token: Token { kind: ContainerToken, service: 127.0.0.1:7359 }, ] for AM appattempt_1479988153262_0002_000001

2016-11-25 10:25:24,938 INFO org.apache.hadoop.yarn.server.resourcemanager.amlauncher.AMLauncher: Command to launch container container_1479988153262_0002_01_000001 : $JAVA_HOME/bin/java -Djava.io.tmpdir=$PWD/tmp -Dlog4j.configuration=container-log4j.properties -Dyarn.app.container.log.dir=<LOG_DIR> -Dyarn.app.container.log.filesize=0 -Dhadoop.root.logger=INFO,CLA -Dhadoop.root.logfile=syslog  -Xmx1024m org.apache.hadoop.mapreduce.v2.app.MRAppMaster 1><LOG_DIR>/stdout 2><LOG_DIR>/stderr

2016-11-25 10:25:24,938 INFO org.apache.hadoop.yarn.server.resourcemanager.security.AMRMTokenSecretManager: Create AMRMToken for ApplicationAttempt: appattempt_1479988153262_0002_000001

2016-11-25 10:25:24,938 INFO org.apache.hadoop.yarn.server.resourcemanager.security.AMRMTokenSecretManager: Creating password for appattempt_1479988153262_0002_000001

2016-11-25 10:25:25,939 INFO org.apache.hadoop.ipc.Client: Retrying connect to server: localhost/127.0.0.1:7359. Already tried 0 time(s); retry policy is RetryUpToMaximumCountWithFixedSleep(maxRetries=10, sleepTime=1000 MILLISECONDS)

2016-11-25 10:25:26,940 INFO org.apache.hadoop.ipc.Client: Retrying connect to server: localhost/127.0.0.1:7359. Already tried 1 time(s); retry policy is RetryUpToMaximumCountWithFixedSleep(maxRetries=10, sleepTime=1000 MILLISECONDS)

2016-11-25 10:25:27,940 INFO org.apache.hadoop.ipc.Client: Retrying connect to server: localhost/127.0.0.1:7359. Already tried 2 time(s); retry policy is RetryUpToMaximumCountWithFixedSleep(maxRetries=10, sleepTime=1000 MILLISECONDS)

2016-11-25 10:25:28,941 INFO org.apache.hadoop.ipc.Client: Retrying connect to server: localhost/127.0.0.1:7359. Already tried 3 time(s); retry policy is RetryUpToMaximumCountWithFixedSleep(maxRetries=10, sleepTime=1000 MILLISECONDS)

2016-11-25 10:25:29,942 INFO org.apache.hadoop.ipc.Client: Retrying connect to server: localhost/127.0.0.1:7359. Already tried 4 time(s); retry policy is RetryUpToMaximumCountWithFixedSleep(maxRetries=10, sleepTime=1000 MILLISECONDS)

重复......

2016-11-25 10:31:33,264 INFO org.apache.hadoop.ipc.Client: Retrying connect to server: localhost/127.0.0.1:7359. Already tried 7 time(s); retry policy is RetryUpToMaximumCountWithFixedSleep(maxRetries=10, sleepTime=1000 MILLISECONDS)

2016-11-25 10:31:34,125 INFO org.apache.hadoop.ipc.Client: Retrying connect to server: localhost/127.0.0.1:7359. Already tried 8 time(s); retry policy is RetryUpToMaximumCountWithFixedSleep(maxRetries=10, sleepTime=1000 MILLISECONDS)

2016-11-25 10:31:34,264 INFO org.apache.hadoop.ipc.Client: Retrying connect to server: localhost/127.0.0.1:7359. Already tried 8 time(s); retry policy is RetryUpToMaximumCountWithFixedSleep(maxRetries=10, sleepTime=1000 MILLISECONDS)

2016-11-25 10:31:35,126 INFO org.apache.hadoop.ipc.Client: Retrying connect to server: localhost/127.0.0.1:7359. Already tried 9 time(s); retry policy is RetryUpToMaximumCountWithFixedSleep(maxRetries=10, sleepTime=1000 MILLISECONDS)

2016-11-25 10:31:35,128 INFO org.apache.hadoop.yarn.server.resourcemanager.amlauncher.AMLauncher: Error launching appattempt_1479988153262_0002_000001. Got exception: java.net.ConnectException: Call From vm10-0-0-2.ksc.com/127.0.0.1 to localhost:7359 failed on connection exception: java.net.ConnectException: Connection refused; For more details see:  http://wiki.apache.org/hadoop/ConnectionRefused        

at sun.reflect.GeneratedConstructorAccessor39.newInstance(Unknown Source)        

at sun.reflect.DelegatingConstructorAccessorImpl.newInstance(DelegatingConstructorAccessorImpl.java:45)        

at java.lang.reflect.Constructor.newInstance(Constructor.java:526)        at org.apache.hadoop.net.NetUtils.wrapWithMessage(NetUtils.java:792)       

 at org.apache.hadoop.net.NetUtils.wrapException(NetUtils.java:732)        at org.apache.hadoop.ipc.Client.call(Client.java:1479)        

at org.apache.hadoop.ipc.Client.call(Client.java:1412)        at org.apache.hadoop.ipc.ProtobufRpcEngine$Invoker.invoke(ProtobufRpcEngine.java:229)        

at com.sun.proxy.$Proxy81.startContainers(Unknown Source)        

at org.apache.hadoop.yarn.api.impl.pb.client.ContainerManagementProtocolPBClientImpl.startContainers(ContainerManagementProtocolPBClientImpl.java:96) 

 at org.apache.hadoop.yarn.api.impl.pb.client.ContainerManagementProtocolPBClientImpl.startContainers(ContainerManagementProtocolPBClientImpl.java:96)        

at sun.reflect.GeneratedMethodAccessor14.invoke(Unknown Source)        

at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)        

at java.lang.reflect.Method.invoke(Method.java:606)       

 at org.apache.hadoop.io.retry.RetryInvocationHandler.invokeMethod(RetryInvocationHandler.java:191)       

 at org.apache.hadoop.io.retry.RetryInvocationHandler.invoke(RetryInvocationHandler.java:102)        

at com.sun.proxy.$Proxy82.startContainers(Unknown Source)       

 at org.apache.hadoop.yarn.server.resourcemanager.amlauncher.AMLauncher.launch(AMLauncher.java:118)        

at org.apache.hadoop.yarn.server.resourcemanager.amlauncher.AMLauncher.run(AMLauncher.java:250)        

at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1145)       

 at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:615)        

at java.lang.Thread.run(Thread.java:745)Caused by: java.net.ConnectException: Connection refused       

 at sun.nio.ch.SocketChannelImpl.checkConnect(Native Method)       

 at sun.nio.ch.SocketChannelImpl.finishConnect(SocketChannelImpl.java:744)       

 at org.apache.hadoop.net.SocketIOWithTimeout.connect(SocketIOWithTimeout.java:206)        

at org.apache.hadoop.net.NetUtils.connect(NetUtils.java:531)        

at org.apache.hadoop.net.NetUtils.connect(NetUtils.java:495)
       

 at org.apache.hadoop.ipc.Client$Connection.setupConnection(Client.java:614)
       

 at org.apache.hadoop.ipc.Client$Connection.setupIOstreams(Client.java:712)
      

  at org.apache.hadoop.ipc.Client$Connection.access$2900(Client.java:375)
      

  at org.apache.hadoop.ipc.Client.getConnection(Client.java:1528)
      

  at org.apache.hadoop.ipc.Client.call(Client.java:1451)
    

    ... 15 more



运行 job 时 发送卡顿,  到  




  时就不动了。 然后查看 yarn-hadoop-resourcemanager-vm10-0-0-0.ksc.com.log 日志,发现上面的问题。

1  修改类配置文件 ,一直不好,甚至重新配置 删除了hadoop 有重新配置了一次也没有好。

网上资料说是: 配置   有关于yarn的  有可能是资源分配不对 , 还有的hadoop/tmp/dir  路径不要配置在  /tmp  的临时文件路径下 ,我的都不是。

2 修改 etc/hosts   和 etc/hostname 文件 

     hostname 文件影响不大, 看情况配置。

     hosts 文件 ,因为我配置的是伪分布式集群,所以  第一行 127.0.01  localhost  是必须有的, 但是真正集群的时候,网上的有的说不需要 。个人可以试试。

    

解决   ,都试过后 看见一个贴子 

http://anyoneking.com/archives/603     hadoop数据节点通信异常


了解到 这个是 连接不到 namenode 节点 , 之前本人也通过判断是这个原因 。

补充一点 :之前只是在运行 job 时 爆出 连接不到的问题 ,其他正常启动 。

最后 看到他在 修改掉近期的 别人修改的hosts 文件(添加 127.0.0.1 localhost 时) ,去除掉 ,没有好, 但是重启后就可以了。

本人也重启了一下 ,然后奇迹般的好了。 这个可能是哪里缓存了一些数据影响到了 环境的配置与修改 。


这里mark一下 。


  • 2
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
org.apache.hadoop.ipc.client是一个用于与Hadoop集群中的远程服务器进行通信的客户端库。在这个特定的错误信息中,它显示了客户端正在尝试连接到服务器“k8s-master/192.168”。 这个错误可能有几个可能的原因: 1. 连接问题:客户端无法与服务器建立连接。可能的原因是服务器故障、网络问题或客户端配置错误。首先,我们应该检查服务器是否可用,并确保网络连接正常。然后,我们可以检查客户端的配置文件,确保服务器地址和端口号正确配置。 2. 服务器问题:服务器可能无法响应客户端的请求。这可能是由于服务器过载、资源不足或程序错误引起的。我们可以检查服务器的日志文件,以了解是否有任何错误或异常。 3. 安全问题:如果服务器设置了安全配置,客户端可能无法通过身份验证,导致连接失败。这是一个常见的问题,在这种情况下,我们需要确保客户端具有正确的凭据和权限来连接服务器。 为了解决这个问题,我们可以采取以下步骤: 1. 检查服务器的可用性和网络连接。确保服务器正常运行,并且可以通过网络连接到它。 2. 检查客户端的配置文件,确保服务器地址和端口号正确配置。 3. 检查服务器的日志文件,寻找任何异常或错误信息。 4. 如果服务器配置了安全性,确保客户端具有正确的凭据和权限来连接服务器。 如果以上步骤仍然无法解决问题,可能需要进一步调试和排除故障,包括与系统管理员或开发人员进行联系以获取更多支持。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值