hadoop入门

最新推荐文章于 2024-07-29 09:10:44 发布

6:00a.m

最新推荐文章于 2024-07-29 09:10:44 发布

阅读量425

点赞数 10

文章标签： hadoop 大数据分布式

本文链接：https://blog.csdn.net/qjy123456_/article/details/138092138

版权

一.Hadoop简介
（一）Hadoop介绍
狭义上Hadoop指的是Apache软件基金会的一款开源软件。
用java语言实现，开源
允许用户使用简单的编程模型实现跨机器集群，对海量数据进行分布式计算处理
Hadoop核心组件
Hadoop HDFS（分布式文件存储系统）：解决海量数据存储
Hadoop YARN（集群资源管理和任务调度框架）：解决资源任务调度
Hadoop MapReduce（分布式计算框架）：解决海量数据计算
广义上Hadoop指的是围绕Hadoop打造的大数据生态圈

（二）hadoop优点

scalability：扩容能力强：Hadoop是在可用的计算机集群间分配数据并完成计算任务的，这些集群可方便灵活的方式扩展到数以千计的节点。
economical：成本低：Hadoop集群允许通过部署普通廉价的机器组成集群来处理大数据，以至于成本很低。看重的是集群整体能力。
efficiency：效率高：通过并发数据，Hadoop可以在节点之间动态并行的移动数据，使得速度非常快。
reliability：可靠性高：能自动维护数据的多份复制，并且在任务失败后能自动重新部署（redeploy）计算任务。所以Hadoop的按位存储和处理数据的能力值得人们信赖。
二.hadoop集群介绍

Hadoop集群包括两个集群（物理层面）：HDFS集群、YARN集群
两个集群逻辑上分离、通常物理上在一起
两个集群都是标准的主从架构集群
HDFS集群是一个分布式存储系统，它当中的主角色叫做NameNode，简称NN，从角色叫做DataNode，简称DN，主角色辅助角色叫做SecondaryNameNode，简称SNN。
YARN集群主要负责资源管理和任务调度，它当中的主角色叫做ResourceManager，简称RM，从角色叫做NodeManager，简称NM。

6:00a.m

关注

10
点赞
踩
6

收藏

觉得还不错? 一键收藏
1
评论
hadoop入门

HDFS集群是一个分布式存储系统，它当中的主角色叫做NameNode，简称NN，从角色叫做DataNode，简称DN，主角色辅助角色叫做SecondaryNameNode，简称SNN。YARN集群主要负责资源管理和任务调度，它当中的主角色叫做ResourceManager，简称RM，从角色叫做NodeManager，简称NM。scalability：扩容能力强：Hadoop是在可用的计算机集群间分配数据并完成计算任务的，这些集群可方便灵活的方式扩展到数以千计的节点。两个集群都是标准的主从架构集群。
复制链接

扫一扫