windows 7 ip地址信息保存在哪个文件里_大数据 分布式文件系统 HDFS原理详解

​HDFS是Hadoop Distribute File System 的简称,也就是Hadoop的一个分布式文件系统。

1、HDFS有什么作用

1)高容错:提供较高的容错率,因为数据有备份,通过机架感知策略,namenode会尽量将数据的复本放到不同的机架上,所以小规模的宕机不影响数据的存储。对于网络的就近原则,先近再远,如果有多个机架,会在多个机架建立副本。

宕机:操作系统无法从一个严重系统错误中恢复过来,或系统硬件层面出问题,以致系统长时间无响应,而不得不重新启动计算机的现象。

2)成本低:可以使用低成本的硬件搭建一个分布式文件系统。

3)规模大:能提供大规模的数据存储,上TB、PB级的规模。

4)高吞吐:高吞吐的数据访问,获得一个完整的数据可以从多个机器上同时读取。

5)读取方式多样:计算时数据读取的方式多采用本地化方式,如果本地化方式不满足则采用临近网络的方式,这也是通过机架感知策略。

2、机架感知策略的实现机制

默认情况下,Hadoop机架感知是没有启用的,需要在NameNode机器的hado

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值