hadoop那些事儿_1

本文记录了一次生产Hadoop集群遇到的问题,包括启动缓慢、服务器时间不同步以及HDFS与HBase异常。通过分析日志,发现了Xceiver数量超出限制的问题,调整`dfs.datanode.max.xceievers`参数解决了并发问题,优化了集群性能。
摘要由CSDN通过智能技术生成

一、背景

1、上周生产集群加入几台节点,执行start-balancer后进度十分地缓慢,连续几天未完成。

2、屋漏偏逢连夜雨,周六供电线路被施工挖断,机房UPS在坚持几个小时后,集群整体宕掉。

3、周一供电正常后,集群再次启动。

二、问题

1、症状

(1)hadoop,hdfs启动后上传文件正常,日志中未发现异常。

(2)hbase,可以启动,但是启动后很多表的regions无法正常加载,执行hbase hbck异常比较多。hbase启动后hdfs上传文件出现错误。hbase表可以访问,但是其访问速度异常地慢。

2、解决

(1)排除硬件服务器异常。

(2)通过检查发现部分服务器的时间未与时钟服务器同步,手机同步一次,检查及重新配置执行计划。

(3)重点,根据节点日志上报的明显错误,调整了hdfs-site.xml中的参数。重启hdfs及hbase后正常。

三、日志

1、hadoop hdfs上传文件报出问题
17/03/29 13:30:31 INFO hdfs.DFSClient: Exception in createBlockOutputStream
java.io.EOFException: Premature EOF: no length prefix available
    at org.apache.hadoop.hdfs.protocolPB.PBHelper.vintPrefixed(PBHelper.java:2282)
    at org.apache.hadoop.hdfs.DFSOutputStream$DataStreamer.createBlockOutputStream(DFSOutputStream.java:1346)
    at org.apache.hadoop.hdfs.DFSOutputStream$DataStreamer.nextBlockOutputStream(DFSOutputStream.java:1266)
    at org.apache.hadoop.hdfs.DFSOutputStream$DataStreamer.run(DFSOutputStream.java:449)
17/03/29 13:30:31 INFO hdfs.DFSClient: Abandoning BP-903121414-10.141.17.33-1461912427616:blk_1076230712_2574868
17/03/29 13:30:31 INFO hdfs.DFSClient: Excluding datanode DatanodeInfoWithStorage[10.141.17.47:50010,DS-9cf11117-1b97-400e-87f7-0dd4aad6c266,DISK]
17/03/29 13:30:31 INFO hdfs.DFSClient: Exception in createBlockOutputStream
java.io.IOException: Got error, status message , ack wi

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值