HDFS数据存储与通信

数据存储特点

数据读写一定依赖于元数据信息 , 元数据信息丢失,数据无法找到

  • 数据以固定的物理切块大小存储在不同的机器上 [128M 可以修改]

  • 每个物理切块多副本存储在不同的节点上 [3个]

  • 在每个DataNode节点上 ,存储数据的目录是统一的

[root@linux03 subdir0]# pwd
/opt/hdpdata/data/current/BP-1889122556-192.168.133.33-
1638070839467/current/finalized/subdir0/subdir0
[root@linux03 subdir0]# 
  • 在HDFS上存储的数据 , 实时不高 ,读取效率低

  • HDFS上数据 , 管理是以文件块为单位, 所以不能直接随机的更新数据

  • 适合一次存储, 多次读取分析的非实时性需求

  • HDFS不适合存储大量的小文件 , 每个小文件都会记录元数据 , 增加NN的压力

  • HDFS也不是可以无限扩容(内存有限)

NN和DN通信

      

<property>
  <name>dfs.namenode.heartbeat.recheck-interval</name>
  <value>300000</value>
  <description>
    This time decides the interval to check for expired datanodes.
    With this value and dfs.heartbeat.interval, the interval of
    deciding the datanode is stale or not is also calculated.
    The unit of this configuration is millisecond.
  </description>
</property>

<property>
  <name>dfs.heartbeat.interval</name>
  <value>3</value>
  <description>Determines datanode heartbeat interval in seconds.</description>
</property>

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值