Hadoop学习笔记3

HDFS存储原理

1.block 管理单位

默认256MB

如丢失了某个块,导致文件不完整-> 通过多个副本解决(备份)

设置,默认文件上传到HDFS中拥有的副本数量:hdfs-site.xml

属性默认是3,除非需要特殊设置,不需要修改

  <property>
    <name>dfs.replication</name>
    <value>3</value>
  </property>

上传文件的时候,临时决定上传以多少个副本存储

hadoop fs -D dfs.relication=2 -put test.txt /tmp/

对于已经存在的HDFS的文件,修改dfs.replication属性不会生效,如果需要修改已经存在的文件可以通过命令:

hadoop fs -setrep [-R] 2 path

查看副本数

hdfs fsck path [-files[-blocks[-locations]]]

Block配置:

块大小可以通过参数,默认设置是256MB一个,一个1G的文件会被划分为4个block存储

<property>
    <name>dfs.blocksize</name>
    <value>268435456</value>
    <description>
</property>

2.NameNode元数据

namenode基于edits文件和fsimage文件管理块

edits:流水账文件,记录hdfs中的每一次操作,以及被操作影响的blocks

fsimage:edits合并,记录数据的最终状态,压缩edits的空间

元数据合并---SecondaryNameNode实现,通过http协议拉到数据,拉到数据之后在自己的内存中合并之后发送出去

3.HDFS数据的读写流程

数据写入流程

数据读取流程

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值