HDFS简单入门

HDFS入门

1.HDFS也是主从的结构,主为namenode,从为datanode;

  namenode:用来存放客户端向HDFS中提交的文件记录,datanode:用来存放具体的文件块。

  客户端上传文件给HDFS时,会被切分成很多的块,在Hadoop1.x时代一个块是60M,2.x时代一个块默认值为128M,而且不同的块在不同的机器中也有具体的副本,默认副本数   量是3个。

2.secondarynamenode在主节点机器中以一个进程的方式来启动;

  secondary namenode:客户端向HDFS提交文件时,会被写入到内存中,同时也会向磁盘的edits文件中记录具体的操作步骤,同时也会生成一个fsimage记录镜像文件,该文件的内容就是记录当前进程中的文件元数据,当namenode节点重启时,内存中的元数据消失了,再重启时会立即从fsimage中把具体的元数据信息加载的内存,速度非常快,但是fsimage中的内容是何时写入的,这个就是secondarynamenode会有一个定时的任务,定期的慧聪namenode中把edits和fsimage文件下载过去,在进行合并,合并后再发送给namenode中覆盖原先的fsimage,这样当namenode重启时,直接把fsimage的内容加载到内存作为元数据的信息恢复,这样会很快。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值