重启集群的时候发现HBase的HRegionServer 服务启动失败

 

今天在测试环境下的集群重启了下,启动Hbase的时候报错:

$ sh  start-hbase.sh 
starting master, logging to /home/hadoop/hbase-0.96.1.1-cdh5.0.2/logs/hbase-hadoop-master-master241.out
SLF4J: Class path contains multiple SLF4J bindings.
SLF4J: Found binding in [jar:file:/home/hadoop/hbase-0.96.1.1-cdh5.0.2/lib/slf4j-log4j12-1.7.5.jar!/org/slf4j/impl/StaticLoggerBinder.class]
SLF4J: Found binding in [jar:file:/home/hadoop/hadoop-2.3.0-cdh5.0.2/share/hadoop/common/lib/slf4j-log4j12-1.7.5.jar!/org/slf4j/impl/StaticLoggerBinder.class]
SLF4J: See http://www.slf4j.org/codes.html#multiple_bindings for an explanation.
SLF4J: Actual binding is of type [org.slf4j.impl.Log4jLoggerFactory]

logs日志信息

  [main] util.VersionInfo: HBase 0.96.1.1-cdh5.0.2
2015-04-16 10:07:27,354 INFO  [main] util.VersionInfo: Subversion file:///var/lib/jenkins/workspace/generic-binary-tarball-and-maven-deploy/CDH5.0.2-Packaging-HBase-2014-06-09_10-36-58/hbase-0.96.1.1-cdh5.0.2 -r Unknown
2015-04-16 10:07:27,354 INFO  [main] util.VersionInfo: Compiled by jenkins on Mon Jun  9 10:45:35 PDT 2014
2015-04-16 10:07:27,510 INFO  [main] zookeeper.ZooKeeper: Client environment:zookeeper.version=3.4.5-cdh5.0.2--1, built on 06/09/2014 16:09 GMT
2015-04-16 10:07:27,510 INFO  [main] zookeeper.ZooKeeper: Client environment:host.name=master241

jps查看启动进程有HMaster

解决办法:

问题原因:

转载于:https://www.cnblogs.com/zhanggl/p/4431243.html

### 回答1: 当HBase的HRegionServer挂掉时,可能会导致数据不可用或无法访问。此时需要进行以下操作: 1. 检查HRegionServer的日志,查看是否有异常或错误信息。 2. 检查Hadoop集群的状态,确保所有节点都正常运行。 3. 尝试重启HRegionServer,如果无法重启,则需要进行故障排除。 4. 如果HRegionServer无法恢复,则需要进行数据恢复操作,例如使用备份数据或从其他节点复制数据。 5. 在HBase集群中使用多个HRegionServer可以提高可用性和性能,因此建议使用多个HRegionServer来避免单点故障。 ### 回答2: 当HBase的HRegionServer挂掉时,会对整个HBase集群造成严重的影响。因为HBase是基于分布式架构的,HRegionServer是其中一个重要的组成部分。因此,如果一个或多个HRegionServer挂掉,会导致HBase集群无法正常工作。 造成HRegionServer挂掉的原因有很多,比如网络故障、硬件故障、软件异常等。无论是哪种原因,都需要采取相应的措施来解决问题,以保证HBase集群的稳定运行。 首先,我们需要检查HRegionServer挂掉的原因。我们可以查看日志文件或者使用命令行工具来获取更多的信息。一旦我们确定了原因,我们就可以采取相应的措施来解决问题。 如果是硬件故障,我们需要更换或修理故障的硬件设备。如果是网络故障,我们需要检查网络连接并修复故障。如果是软件异常,我们可以尝试重新启动HRegionServer或者在其他节点上重新启动服务。 此外,为了避免HRegionServer挂掉的情况,我们还可以采取一些预防措施。比如,我们可以在HBase集群中添加足够的备用节点,以便在出现故障时可以快速地替换故障节点。我们也可以使用监控工具来监控HBase集群的运行状况,及时发现并解决问题。 总之,HBase的HRegionServer挂掉是一个严重的问题,需要及时采取措施来解决。我们需要对HBase集群的运行状况进行严密的监控,及时处理任何可能导致故障的问题,以保证HBase集群的持续稳定运行。 ### 回答3: HBase是一种可扩展的面向列的NoSQL数据库,与关系数据库不同,它可以处理分布式数据存储。HRegionServerHBase中重要的组件之一。它被设计用于处理HBase表中特定的数据区域,即Region。如果HRegionServer挂掉了,HBase表中包含的数据区域就需要重新分配到其他HRegionServer的实例上。 HRegionServer的故障可能是由多种原因造成的。可能是由于操作系统内存不足,硬件故障、网络故障或其他问题造成的。当HRegionServer挂掉时,HBase集群就会变得不可用,除非故障的节点上的HRegionServer被替换或恢复。 为了避免这种情况,HBase管理员应该监视HRegionServer的健康状况。当发现HRegionServer故障时,管理员应该采取以下步骤: 1. 确认问题:首先需要确认HRegionServer确实已经挂掉,而不是网络或其他问题导致的连接问题。可以通过查看日志文件或检查监控工具来确认。 2. 重新分配Region:当确认HRegionServer已经挂掉时,HBase会自动重新分配该HRegionServer上的Region到其他可用节点。这需要一定的时间,但不会影响对HBase表的读取和写入。 3. 恢复:如果HRegionServer上的数据对于生产环境非常重要,则需要尽快恢复。可以通过停止并重新启动HRegionServer来实现。重新启动后,HBase将自动分配该HRegionServer上的Region。 4. 预防:为了避免HRegionServer故障,HBase管理员可以采取措施,如监视HRegionServer的健康状况,规划适当的负载均衡策略,定期备份数据等。 总之,HRegionServer挂掉后需要进行重新分配Region和恢复。为了避免发生此类故障,管理员需要监视HRegionServer的健康状况,并采取预防措施。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值