1.怎么理解分布式?
分布式需要从计算和存储两个方面来讨论:
分布式计算:是一种计算方法,是将该应用分解成许多小的部分,分配给多台计算机进行处理。这样可以节约整体计算时间,大大提高计算效率。
分布式存储,是一种数据存储技术,通过网络使用企业中的每台机器上的磁盘空间,将这些分散的存储资源构成一个虚拟的存储设备,数据分散存储在企业的各个角落,多台服务器。
2.hadoop 的组成部分
a、HDFS
i. 管理者:NameNode
ii. 工作者:DataNode
iii. 辅助管理者:SecondaryNameNode
b、 MapReduce
c、 Yarn
i. 管理者:ResourceManager
ii. 工作者:NodeManager
3.HDFS副本存放机制
i. 第一副本来源于客户端
ii. 第二副本按照一定规则存放在与第一副本相同机架上的不同节点
iii. 第三副本按照一定规则存放在与第一二副本逻辑距离最近的不同机架上的随机节点上
4.Namenode作用
a、维护管理文件系统的名字