Ubuntu上使用Hadoop 2.x 十二 HDFS Cluster HA QJM和Federation联合使用

最新推荐文章于 2018-06-21 23:04:43 发布

VIP文章左手程序右手拳

最新推荐文章于 2018-06-21 23:04:43 发布

阅读量2.9k

点赞数

分类专栏： # Hadoop 文章标签： hadoop ubuntu

本文链接：https://blog.csdn.net/csfreebird/article/details/21473915

版权

扩展性和容错的解决方案

现在已经有了Federation集群，这样就能提供Hadoop大集群的解决方案。不过对于单个namenode server，还是需要HA QJM来提供单点故障的解决方案，使得其可以自动的故障切换。

之前我已经有了两个namenode1和namenode2 server，分别用于管理两个namespace。现在把它们看成active machine, 并clone出两个虚拟机，作为它们的standby machine.

同时QJM需要至少3个JournalNodes，为了省机器，就用datanode1, datanode2和datanode3作为namenode1的JournalNodes. 再创建三个datanode server，同时也作为namenode2的JournalNodes.

架构图：

配置

添3个datanode到federation中

从datanode1中clone出虚拟机，然后复制到另一台物理主机中，安装后，再克隆出2份

完成之后，发现一个奇怪的现象，每个namenode只能看到3台datanode server, 而且每次看到的还不同。

hduser@namenode1:~$ hdfs dfsadmin -printTopology  
Rack: /168/1
   192.168.1.73:50010 (datanode1)
   192.168.1.74:50010 (datanode2)
   192.168.1.75:50010 (datanode3)

hd

最低0.47元/天解锁文章

优惠劵

左手程序右手拳

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Ubuntu上使用Hadoop 2.x 十二 HDFS Cluster HA QJM和Federation联合使用

Federation结合使用HA QJM
复制链接

扫一扫

专栏目录

Hadoop_2.X_HDFS源码剖析_带索引书签目录_徐鹏

05-09

Hadoop_2.X_HDFS源码剖析_带索引书签目录_徐鹏,内容不错，值得阅读！

hdfs增加ns之后，重启DN报clusterId不匹配错误

快乐程序员的专栏

12-09

2930

在测试环境准备测试FastCopy，因为之前只有一个NS，准备增加一个NS也便于测试，一切都准备妥当之后，重启DN，但是DN死活连接不上新的NN，报以下错误：

参与评论您还未登录，请先登录后发表或查看评论

hadoop2.7.3在集群中配置多个namenode(federation cluster)

archer的技术故事

12-01

1万+

hadoop2.7.3在集群中配置多个namenode 首先需要说明的是，在集群中配置多个namenode和在集群中使用secondaryNamenode是完完全全的两码事。具体是如何区分的，我之后会在写一篇haoop官方当中的译文，同时解释一下这两者的区别。在这里先简答的说一下。secondaryNamenode的作用是给namenode分担压力的，会定时的帮助namenode做一些处理。而配

hadoop federation部署实践,亲测

菜皮的默默倾诉

11-27

2212

hdfs federation也就是hdfs联盟,出现这个东西是为了解决namenode的容量不够存放hdfs文件的元数据.就像我们的电脑一样,你的c盘就是namenode,其他的盘是datanode.你往datanode上写数据,namenode需要写入一些元数据,比如文件存放在那个机器上,那个快上.当数据量特别大大,我们的c盘,也就是namnode就不够用了,这时候就引入了联盟这个概念.hdf

HDFS利用QJM实现HA（HDFS High Availability Using the Quorum Journal Manager）

宁静致远厚积薄发

11-27

971

目的本指南概述HDFS的高可用性(HA)的特性,以及如何配置和管理HA HDFS集群,使用QJM特性。本文假设读者有一个大致了解通用组件和一个HDFS集群中的节点类型。详情请参阅HDFS架构指南。注意：QJM或者共享存储本指南将要讨论如何配置并利用QJM实现HA,HA是通过在活动的NameNode与备份的NameNode之间共享edit日志，对于如何通过共享存储代替

【中英】【吴恩达课后编程作业】Course 4 -卷积神经网络 - 第四周作业

热门推荐

何宽的博客

06-21

11万+

【中文】【吴恩达课后编程作业】Course 4 - 卷积神经网络 - 第四周作业 - 人脸识别与神经风格转换

Hadoop 2.X HDFS源码剖析

04-26

第3~5章分别介绍了Namenode、Datanode以及HDFS客户端这三个组件的实现细节，同时穿插介绍了HDFS 2.X的新特性，例如Namenode HA、Federation Namenode等。阅读《Hadoop 2.X HDFS源码剖析》可以帮助读者从架构设计与...

Hadoop 3.x（HDFS）----【HDFS 的 API 操作】---- 代码

09-10

Hadoop 3.x（HDFS）----【HDFS 的 API 操作】---- 代码 Hadoop 3.x（HDFS）----【HDFS 的 API 操作】---- 代码 Hadoop 3.x（HDFS）----【HDFS 的 API 操作】---- 代码 Hadoop 3.x（HDFS）----【HDFS 的 API 操作】--...

Hadoop 2.x与3.x 22点比较,Hadoop 3.x比2.x的改进

01-11

Hadoop3版本中添加了哪些新功能，Hadoop3中兼容的Hadoop 2程序，Hadoop 2和Hadoop 3有什么区别？二、Hadoop 2.x与Hadoop 3.x比较本节将讲述Hadoop 2.x与Hadoop 3.x之间的22个差异。现在让我们逐一讨论 2.1...

Hadoop2.x HA环境搭建

12-09

Hadoop2.x HA环境搭建Hadoop2.x HA环境搭建Hadoop2.x HA环境搭建

HDFS-2.0社区版的HA+Federation的实现解析

xhh198781的专栏

03-29

3060

在Hadoop的1.x版本中,NN的单点处理能力成为HDFS的主要(容量扩展/性能/可用性)瓶颈,主要表现在:一.NN在管理大规模的命名空间时,所消耗的内存堆必定在10GB/100GB级别,无论是触发的Full Gc(32GB需要2min)还是重启时(元数据加载/操作日志回放/数据块汇报)时间消耗对高可用性来说都是无可忍受的;二是NN在内部用一把全局锁撸遍所有的元数据操作来保证数据的一致性;三是被

HDFS Federation(HDFS 联邦)（hadoop2.3）

亡の剑指

04-11

1226

最早接触Federation这个词还是第一家公司用的DB2联邦数据库。第一代hadoop HDFS：结构上由一个namenode和众多datanode组成。功能上划分为namespace和block storage service 两部分。所谓的HDFS Federation就是有多个namenode（或者说namespace）。如图：

Hadoop2.2.0基于QJM的HA实践

张兆坤

01-05

7950

日志分析集群已经搭建起来了，但是我总觉得NN没有采用HA是一个大大的隐忧，让我一直不敢把测试集群正式投入使用，总是担心把大批量的日志文件弄过来后，NN挂掉或者硬盘故障的话那就什么都白费工夫，遂决定要把NN的HA也搞起来。 Hadoop2.2.0的NN的HA目前有两种方式，贫民的方式自然是QJM了，它会采用类似Zookeepr的方式来保存NN的LOG，而NFS的模式显然不是我等几台机器组成的集群的

hadoop datanode重启出现namenode的clusterID和datanode的不一致。

木易的专栏

05-10

9683

日志报出的错误是这样的： 016-05-10 15:14:05,620 FATAL org.apache.hadoop.hdfs.server.datanode.DataNode: Initialization failed for block pool Block pool (storage id DS-6116241-10.20.18.160-50010-1462417536805) se

HDFS用户权限管理

Dean Chen的专栏

11-08

3万+

超级用户启动namenode服务的用户就是超级用户具体配置参考之前我的博客Ubuntu上使用Hadoop 2.x 一 hdfs超级用户创建和设置 CentOS 6.6 安装 HDFS 2.7.1 设计思想很多设计原子POSIX文件系统，可以参考之前的博客 Linux用户管理命令文件和

查看hive版本

Dean Chen的专栏

06-22

3万+

hive没有提供hive --version这种方式查看版本好，所以要找到hive所在目录，然后查看jar包的版本号，比如：# ls /usr/local/hive/lib/ antlr-2.7.7.jar datanucleus-core-2.0.3.jar hive-jdbc-0.10.0.jar jline-1.0.ja

Hive创建外部表以及分区

Dean Chen的专栏

05-31

1万+

创建外部表的好处是数据可以随时从hdfs中挂载进表中使用分区的好处是可以缩短查询范围下面的例子展示了如何创建外部表CREATE EXTERNAL TABLE my_daily_report( last_update string, col_a string, col_b string, col_c string, col_d string, col_

hdfs test 命令

Dean Chen的专栏

10-19

8806

有时候需要写一个脚本测试hdfs中的某个文件或者目录是否存在，比如当接收机发现磁盘分区剩余空间已经到了危险值的时候，需要首先测试一下是否日志已经存入HDFS目录，如果是，则可以删除接收机上的本地日志文件，避免磁盘满的事故。下面是hdfs2.0的test命令介绍：hdfs dfs -help-test -[defsz] : Answer various questions about , with

Ubuntu上使用Hadoop 2.x 一 hdfs超级用户创建和设置

Dean Chen的专栏

02-21

7186

在Ubuntu 12.04 server上安装 Hadoop 2.2.0

（1）启动Hadoop2.X的HDFS和Yarn集群

“相关推荐”对你有帮助么？

非常没帮助
没帮助
一般
有帮助
非常有帮助

提交