hadoop集群容灾方案

一般情况下,hadoop集群备份机制采用默认的3份保存,如下图:
 
hadoop集群
filecopysizespace
sample1.dat3100M3*100M
sample2.dat3200M3*200M
sample3.dat3150M3*150M
sample4.dat3125M3*125M
sample5.txt3100M3*100M
 
 
存在问题:
hadoop集群不具备容灾功能!
 
建议
 
 
方案一:
hadoop集群1
filecopysizespace
sample1.dat2100M2*100M
sample2.dat2200M2*200M
sample3.dat2150M2*150M
sample4.dat2125M2*125M
sample5.txt2100M2*100M
+
hdfs集群2
filecopysizespace
sample1.dat2100M2*100M
sample2.dat2200M2*200M
sample3.dat2150M2*150M
sample4.dat2125M2*125M
sample5.txt2100M2*100M
 
 
 
优势分析:
1、如果hadoop集群1出现故障或者员工误删除,比如自杀性误操作“$hadoop fs -rmr /”, hdfs集群2的数据不会丢失,可以做容灾备份;
2、hadoop集群1的数据处理时间可以压缩近1/3,例如现有集群处理一天的数据需要8小时,优化后可以减少到5-6小时;
 
劣势分析:
主要是成本:硬件成本将上升,盘阵的规模需要扩大近1/3,将导致成本的增加近1/3。
 
方案二:
hadoop集群1
filecopysizespace
sample1.dat2100M2*100M
sample2.dat2200M2*200M
sample3.dat2150M2*150M
sample4.dat2125M2*125M
sample5.txt2100M2*100M
+
hdfs集群2
filecopysizespace
sample1.dat1100M1*100M
sample2.dat1200M1*200M
sample3.dat1150M1*150M
sample4.dat1125M1*125M
sample5.txt1100M1*100M
 
 
优势分析:
1、如果hadoop集群1出现故障或者员工误删除,比如自杀性误操作“$hadoop fs -rmr /”, hdfs集群2的数据不会丢失,可以做容灾备份;
2、hadoop集群1的数据处理时间可以压缩近1/3,例如现有集群处理一天的数据需要8小时,优化后可以减少到5-6小时;
3、不会增加任何的成本。
 
方案二总结:
       鉴于将hadoop备份机制由共存3份在一个hadoop集群,优化为2份在一个hadoop集群1,另一份在另一个hdfs集群2,总的空间不变,hadoop集群1的时间却节省近1/3,另外,兼具容灾机制。
 
 
 
以上是一点建议,仅供各位大牛大神参考!
  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值