HADOOP系列之HDFS初步学习

1.HDFS基本概念

HDFS(Hadoop distributed File System)分布式文件系统。主要用于解决海量文件信息的存储和管理,也就是解决数据存储问题。

(1)NameNode(主节点)

 是Hadoop的HDFS的主节点(简称‘老板’),如果namenode关闭,则hadoop集群就没法正常访问。NameNode主要负责管理客户端对文件的访问,记录客户端对文件系统的修改操作。

(2)DataNode(数据节点)

是Hadoop的HDFS的从节点(简称‘员工’),也称为数据节点。在HDFS中数据存放的形式是以块(Block)为单位,而这些块就存放在DataNode节点中。而由于企业级开发数据大部分是海量数据,也因此存储DataNode机器大都是需要大容量磁盘。

 老板和员工之间上下级关系,这也好比主从节点之间的关系,老板(主节点)和员工(从节点)之间在工作期间保持着联系,而员工为客户(客户端)和老板工作(调度)。员工不断的为公司创造利益(存储和检索数据块),并完成数据块的操作,而且会报告自己的信息(数据块)给老板。

(3)Block(块)

Hadoop2.0以上默认的是128M,且备份3份。

(4)Metadata(元数据)

元数据大概分为三种形式:

  1.  在HDFS中维护文件和目录信息,如文件名、文件创建时间、
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值