第一章:Hadoop是什么?

1.Hadoop介绍

Hadoop狭义上是指一款用java语言实现,开源允许用户简单的编程模式实现跨机器集群对海量数据进行分布式计算处理

Hadoop核心组件

  • Hadoop HDFS(分布式文件存储系统):解决海量数据存储;
  • Hadoop YARN(集群资源管理任务调度):解决资源任务调度;
  • Hadoop MapReduce(分布式计算框架):解决海量数据计算;

Hadoop广义上是指围绕Hadoop打造的大数据生态圈
在这里插入图片描述
Hadoop现状

  • HDFS作为分布式文件存储系统,处于生态圈底层和核心地位
  • YARN作为分布式通过的集群资源管理系统和任务调度平台,支持各种计算引擎允许,保证了Hadoop地位;
  • MapReduance作为第一代分布式计算引擎,由于自身设计模式所产生的弊端,导致企业一线 几乎不直接使用MapReduce进行编程处理

Hadoop特性优点

  • 扩容能力强:Hadoop在可用的计算机集群间分配数据并完成计算任务;
  • 成本低:可以通过部署廉价的机器组成集群处理大数据。
  • 效率高:通过并发数据,Hadoop可以在节点之间动态并行的运动数据,使得速度非常快。
  • 可靠性:可以自动维护数据的多份赋值,并且在任务失败后能自动地重新部署计算任务。

分布式与集群两个不同概念

分布式多台机器,每台机器上部署不同组件
集群式多台机器,每台机器上部署相同组件
在这里插入图片描述

参考

https://www.bilibili.com/video/BV1CU4y1N7Sh?p=19&spm_id_from=pageDriver

  • 2
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值