Hadoop学习之HDFS——小白入门笔记

本文介绍了Hadoop的分布式文件系统HDFS,详细讲解了名称节点和数据节点的角色,以及数据的冗余存储策略。还探讨了第二名称节点的作用,以及HDFS在数据读写过程中的处理方式。最后,列举了一些常用的HDFS命令。
摘要由CSDN通过智能技术生成
  • 一、分布式文件系统

1.分布式文件系统解决问题:海量数据的高效存储

2.分布式文件系统是将文件分布存储到多个计算机节点上。(此处的计算机为普通计算机)

3.分布式文件系统的多个节点分为两类:

    名称节点(主节点):文件、目录的操作(创建、删除、重命名等),数据节点与文件块的映射关系

    数据节点(从节点):数据的读取与存储

  • 二、HDFS概念

1.名称节点:管理分布式文件的命名空间。包含FsImage,Editlog两大核心数据结构

        FsImage:维护文件系统树以及文件树中的文件和文件夹中的元数据

         Editlog:记录所有针对文件的创建、删除、重命名操作

名称节点的数据结构

 2.FsImage,Editlog两大数据结构工作过程:

名称节点启动—>FsImage的内容加载到内存—>执行EditLog中的操作(使内存中的数据源保持最新)—>创建新的FsImage+空     

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值