CDH环境快速恢复不同步的JournalNode

最新推荐文章于 2024-06-20 10:55:19 发布

ace1832

最新推荐文章于 2024-06-20 10:55:19 发布

阅读量730

点赞数 1

原文链接：https://www.pianshen.com/article/1954981017/

版权

背景：

CDH集群中一个DataNode节点宕机后所有服务中断，其他节点正常运行并存储了大量新数据。

在恢复宕机节点后，重启其DataNode与JournalNode，之后CM报出JournalNode不同步的错误，如下图。

处理：

1、停止bigdata168上不同步的JournalNode服务（在CM上操作角色）

2、备份bigdata168服务器上JournalNode的数据目录

cp -r /dfs/jn opt/backup

3、删除bigdata168服务器上JournalNode的数据目录下以edits_inprogress_开头的所有文件，注意是edits_inprogress开头的。

4、重启bigdata168服务器上的JournalNode（在CM上操作角色），之后它会自动向正常节点同步数据。

等待一段时间，该JournalNode就会恢复。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

ace1832

关注关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

解决journalnode与NameNode连接问题

weixin_40645193的博客

11-23

1871

org.apache.hadoop.ipc.Client: Retrying connect to server错误的解决的方法。一、问题描述 HA按照规划配置好，启动后，NameNode不能正常启动。刚启动的时候 jps 看到了NameNode，但是隔了一两分钟，再看NameNode就不见了。测试之后，发现下面2种情况： 1）先启动JournalNode，再启动Hdfs，NameNode可以启动并可以正常运行 2）使用start-dfs.sh启动，众多服务都启动了，隔两分钟NameNode会退出，再

0531-6.1-如何手动迁移JournalNode

Hadoop_SC的博客

12-16

863

1 文档编写目的 Fayson在上一篇文章《0530-6.1-如何只是迁移NameNode或JournalNode》，主要介绍了通过Cloudera Manager来界面化向导式迁移JournalNode，本文Fayson主要会实操演示如何手动迁移JournalNode角色。测试环境 1.CDH6.1 2.Redhat7.4 3.HDFS已经启用HA 2 环境准备 1.启用HDFS HA成功...

参与评论您还未登录，请先登录后发表或查看评论

Hadoop： CDH 5--不同步的 JournalNode

09-15

6005

Hadoop： CDH 5--不同步的 JournalNode Author: Fu cloudera manager出现了hdfs的警告，类似下图：解决的思路是： 1、首先解决简单的问题，查看警告提示的设置的阀值时多少，这样就可以快速定位到问题在哪了，果然JournalNode Sync Status提示最先消去； 2、然后解决Sync Status问题，首先找到提示语

【记录】高可用的CDH集群中journalNode与NameNode不同步问题

遇事不决问春风

07-31

2940

打开CDH管理页面可以发现某台journalNode与Namenode不同步。在重启之后发现问题并没有解决。所以开始查journalNode的数据与正常journalNode区别在哪里在根据CDH的配置找到错误的journalNode机器的文件之后发现文件夹为空，其他正常都有一个文件夹这个文件夹中存储的都是edits_*文件，这些文件都是存储的hdfs近期的操作，与fsimage合并就是当前namenode的元数据。而这台坏掉的journalnode没有存储对应的edits文件，所以会报与name.

cdh5 HA涉及的JournalNodes介绍

weixin_34101229的博客

02-27

413

2019独角兽企业重金招聘Python工程师标准>>> ...

搭建5个节点的hadoop集群环境（CDH5）

热门推荐

陌上花开

05-18

5万+

搭建一个分布式的hadoop集群环境，下面是详细步骤，使用cdh5 。提示：如果还不了解Hadoop的，可以下查看这篇文章Hadoop生态系统，通过这篇文章，我们可以首先大致了解Hadoop及Hadoop的生态系统中的工具的使用场景。一、硬件准备基本配置: 操作系统 64位 CPU (英特尔)Intel(R) I3处理器内存 8.00 GB ( 1600 MHz) 硬盘剩余空间 50G 流畅配置: 操作系统 64位

【大数据----Hadoop】CDH版Hadoop环境搭建

Sunny

06-06

1994

1.下载组件首先去CDH网站上下载hadoop组件地址：http://archive.cloudera.com/cdh5/cdh/5/ 注意版本号要与其他的组件CDH版本一致 2.环境配置设置主机名和用户名配置静态IP 配置SSH免密登录配置JDK 3.配置HADOOP 1.新建用户hadoop，从root用户获取/opt文件夹的权限，所有节点都要执行 ...

阿里云主机hadoop2.6.0-cdh5.15.1-HA环境搭建

whiteblacksheep的博客

08-23

658

1.版本组件版本备注 centos centos7.2 JRE jdk-8u45-linux-x64.gz - hadoop hadoop-2.6.0-cdh5.15.1.tar.gz 自己通过源码编译的，具有压缩工具 zookeeper zookeeper-3.4.6.tar.gz 热切，yarn存储数据使用的协调服务 2.阿里云环境搭建具体步骤在这不详...

中通hadoop去CDH的实践之路

ZTOTech的博客

11-08

2043

在整个中通大数据平台中，最核心的是Hadoop基础平台，因为所有的快递数据都是保存在其中，因此，Hadoop的稳定和高效是最核心的。2021年我们去除了cloudera manager的依赖，自主研发了一套监控和运维hadoop的程序。2022年，经过不懈的努力，我们完成了apache hadoop 2.7.5的升级。

管理节点更换磁盘导致JournalNode同步问题

数据源的港湾

10-07

979

现象集群配置了NameNode HA，突然发生一台NameNode节点所在的数据盘如/data1磁盘故障需要更换磁盘，原来的磁盘下面的目录将都不可用。 /data1目录下面的主要目录为dfs目录，更换磁盘并启动hadoop相关服务后，我们发现dfs目录自动创建dfs/dn、dfs/jn及dfs/nn都已经创建，但HDFS仍然不正常，具体为更换磁盘节点的NameNode服务及JournalNode服务异常，如下图所示解决方案出现此问题，是因为更换了磁盘后dfs/jn目录下没有VERSION文件用来

盘点下常见 HDFS JournalNode 异常的问题原因和修复方法

最新发布

明哥的IT随笔

06-20

699

HDFS namenode 有 SPOF 单点故障，因为对客户端提供元数据读写服务的是单一的一个 NameNode，Secondary NameNode 仅仅提供了 HDFS 故障时的可恢复性，而没有提供整个HDFS服务的高可用性；之所以说 Secondary NameNode 仅仅提供了 HDFS 故障时的可恢复性而不是高可用性，是因为 HDFS 发生故障时，Secondary NameNode 并不会自动晋升为 nameNode, 运维管理员需要介入进行手动处理后才能恢复 HDFS 对外服务；

Hadoop基础教程-第9章 HA高可用（9.3 HDFS 高可用运行）（草稿）

与其临渊羡鱼不如退而结网

07-03

503

第9章 HA高可用 9.3 HDFS 高可用运行 9.3.1 HA节点规划节点 IP Zookeeper NameNode JournalNode DataNode node1 192.168.80.131 Y Y Y Y node2 192.168.80.132 Y Y Y Y node...

journalnode文件

zym1117的博客

03-06

6357

前言最近在排查公司Hadoop集群性能问题时,发现Hadoop集群整体处理速度非常缓慢,平时只需要跑几十分钟的任务时间一下子上张到了个把小时,起初怀疑是网络原因,后来证明的确是有一部分这块的原因,但是过了没几天,问题又重现了,这次就比较难定位问题了,后来分析hdfs请求日志和Ganglia的各项监控指标,发现namenode的挤压请求数持续比较大,说明namenode处理速度异常,然后进而分析出是...

Hadoop 增加Journal Node 或者维护Journal Node问题

houzhizhen的专栏

05-27

8089

以hadoop用户执行以下操作: 1.修改etc/hadoop/hdfs-site.xml,在dfs.namenode.shared.edits.dir 配置项中增加相应的新的journal的地址和端口. 2.把etc/hadoop/hdfs-site.xml分发到集群中各服务器. 3.把现有journal中的数据目录拷贝到新journal服务器. 4.在新journal服务器中执行had

ambari增加journalnode服务节点

TURING.DT

04-13

2570

ambari默认3个journalnode节点，但是如果一个节点出现问题，需要增加补充，ambari界面没有操作的选项，所以只能通过其他命令方式操作，看到之前有个文章是将HA降级，之后重新做HA，这样的风险太高了，操作负载，从网上找到了其他方式，分享给需要的朋友，也希望ambari新版本可以将这个增加journalnode功能，添加进去。操作前提示：如果你对ambari这些操作一点都不

修复HDFS JournalNode 的硬盘损坏

小苟的专栏

04-11

1722

如果部署了Cloudera 的HDFS HA，那么在更换了新硬盘后，重启JournalNode 会出现"JournalNotFormattedException: Journal Storage Directory /data/2/dfs/jn/nameservice1 not formatted" 这样的错误。原因是在新的硬盘上的jn 目录下没有VERSION文件用来恢复。解决方法是重新创建对应...

JournalNode无法启动问题排查

qq_27710549的博客

05-29

8906

JournalNode无法启动问题排查

手动迁移JournalNode

raven_41的专栏

01-30

627

1.首先我们停止HDFS服务。 2.把要迁移的节点/data/jn下的数据复制到新的节点上（scp /data/jn 10.xx.xx.11:/data/ 注意目录用户属组和权限必须保持正确） 3.回到HDFS服务的“实例”页面，添加JN角色给新的节点；把旧的jn节点删除 4.重启HDFS服务 5.进入HDFS服务页面，点击“操作”->“滚动编辑”，该步骤主要是为了强制同步3个Jo...

Cloudera CDH4快速入门指南

"CDH4QuickStartGuide是Cloudera公司发布的一份针对CDH4版本Hadoop的快速入门指南，旨在帮助用户了解和使用这一版本的Hadoop分布式计算框架。该指南提供了安装、配置和操作CDH4的基本步骤，以及相关的最佳实践。" ...