hadoop集群容灾方案

最新推荐文章于 2024-05-29 12:04:21 发布

chinalgf

最新推荐文章于 2024-05-29 12:04:21 发布

阅读量4.2k

点赞数

分类专栏：云计算

本文链接：https://blog.csdn.net/morning_pig/article/details/8960820

版权

20 篇文章 0 订阅

订阅专栏

一般情况下，hadoop集群备份机制采用默认的3份保存，如下图：

优势分析：

1、如果hadoop集群1出现故障或者员工误删除，比如自杀性误操作“$hadoop fs -rmr /”, hdfs集群2的数据不会丢失，可以做容灾备份；

2、hadoop集群1的数据处理时间可以压缩近1/3，例如现有集群处理一天的数据需要8小时，优化后可以减少到5-6小时；

劣势分析：

主要是成本：硬件成本将上升，盘阵的规模需要扩大近1/3，将导致成本的增加近1/3。

优势分析：

1、如果hadoop集群1出现故障或者员工误删除，比如自杀性误操作“$hadoop fs -rmr /”, hdfs集群2的数据不会丢失，可以做容灾备份；

2、hadoop集群1的数据处理时间可以压缩近1/3，例如现有集群处理一天的数据需要8小时，优化后可以减少到5-6小时；

3、不会增加任何的成本。

方案二总结：

鉴于将hadoop备份机制由共存3份在一个hadoop集群，优化为2份在一个hadoop集群1，另一份在另一个hdfs集群2，总的空间不变，hadoop集群1的时间却节省近1/3，另外，兼具容灾机制。

以上是一点建议，仅供各位大牛大神参考！

关注

专栏目录