数据仓库入门(HDSF篇,未完结)

一、分布式系统常见的模式。

  • 去中心化模式:各个节点平级,大家协调工作。
  • 中心化模式:有明确的中心,基于中心节点分配工作。也叫做主从模式(master-slaves)

hadoop就是中心化模式。(包括其三大组件,因为在部署的时候会启动对应的主节点和从节点)

 二、HDFS

2.1 HDFS和Hadoop的关系

  • HDFS是hadoop的三大组件之一,是hadoop的分布式文件系统。(hadoop distributed file system)

2.2 HDFS的基础架构

  • NameNode:主角色(只有一个)

        1.是一个独立的进程。当在服务器上启动了NameNode,那么他就有一个进程。

        2.负责管理HDFS的整个文件系统和Datanode。

  • DataNode:从角色(有多个)

        1.是一个独立的进程。

        2.主要负责数据的存储,即存入数据和取出数据。

  • SecondaryNameNode:主角色的辅助角色。

        1.独立进程

        2.帮助NameNode完成元数据的整理工作。(打杂)(元数据是什么后边会介绍到)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值