分布式和集群的区别,hadoop三代架构图(重点!!!!!)

本文介绍了分布式和集群的概念,重点剖析了Hadoop框架,包括HDFS、MapReduce和Yarn组件。详细讲解了Hadoop1.X到3.X的架构变化以及Hadoop集群的不同搭建方式。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >


1.分布式和集群介绍
  • 分布式: 多台机器做不同的事情, 然后组成1个整体.

  • 集群: 多台机器做相同的事情.

    多台机器既可以组成 中心化模式(主从模式), 也可以组成 去中心化模式(主备模式)

    可以参考下面这张例图,更加简单明了。

2.Hadoop框架国内外应用
  • 国外

    • Yahoo雅虎, 节点4.2W+, 超10W核, 总存储350PB+, 每月提交作业 1000W+

  • 国内

    • 阿里巴巴, 节点3000+, 超4W核心, 内存超100TB, 每月提交作业 450W+

  • Hadoop的组成

    • HDFS: 分布式存储框架

    • MapReduce: 分布式计算框架

    • Yarn: 任务接收和调度器

3. Hadoop的架构图(重点)看懂这三张图就完全懂了
  • Hadoop1.X = HDFS + MapReduce

  • Hadoop2.X, 3.X = HDFS + MapReduce + Yarn

  • Hadoop集群高可用模式图解

4.Hadoop集群环境初体验
  • 搭建方式

    • 方式1: Standalone mode 单机模式(几乎没人这么干)

      把所有的服务(namenode, SecondaryNameNode, datanode, ResourceManager, nodemanager)装到1台机器, 适用于: 学习, 调试.

    • 方式2: Cluster mode 集群模式

      node1: namenode, datanode, ResourceManager, nodemanager

      node2: SecondaryNameNode, datanode, nodemanager

      node3: datanode nodemanager

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值