大数据day5~Hadoop集群

本文详细介绍了Hadoop集群的搭建过程,包括HDFS、YARN集群的组成,以及Hadoop的核心组件和优势。在集群规划中强调了资源分配的重要性,并提供了配置文件的类别和作用。关键步骤包括环境准备、安装包、配置文件设置,特别是HDFS的格式化初始化,以及集群的启动方式。
摘要由CSDN通过智能技术生成

1.允许简单的编程模型在大量计算机集群上对大型数据进行分布式处理

Hadoop指Apache的开源框架 核心组件有:

  1. HDFS(分布式文件系统):解决海量数据存储
  2. YARN(作业调度和集群资源管理的框架):解决资源任务调度
  3. MAPREDUCE(分布式运算编程框架):解决海量数据计算

2。Hadoop 发展史  创始人 Doug Cutting 起源于Nutch

发展离不开谷歌的3篇论文

3.优点:

扩容能力

成本低

高效率

可靠性

4、hadoop最受青睐的是互联网领域

 Hadoop集群搭建

集群简介:

包括两个集群:HDFS集群和YARN集群

HDFS负责海量数据存储 NameNode  DataNode SecondaryNameNode

YARN负责海量数据运算时的资源调度  ResourceManager  NodeManeger 

部署方式分为三种:

Standalone mode(独立模式)、Pseudo-Distributed mode(伪分布式)、Cluster mode(集群模式)

集群角色规划(架构)

根据集群服务器硬件设施和软件工作特性合理规划不同组件在不同的机器上避免因为使用资源相同而产生竞争抢夺的问题

原则:

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值