Hadoop

Hadoop的初级学习记录

1.为什么会出现hadoop?

当我们的数据非常大的时候,比如100T的数据,这时候用我们普通的数据库来存储、分析、处理数据的时候就会非常的耗时而且效率特别低,那么这时候就出现了hadoop等的框架来处理大数据的问题。

2.hadoop解决了哪些问题?

(1)利用HDFS来存储数据
(2)用MapReduce来分析处理数据

3.hadoop处理数据的流程是什么?

如果我们现在遇到了这样的一个问题:一个服务器上有2000T的数据这时候我们有两个用户需要访问这台服务器上的数据,这时候如果这台服务器坏了那么我们的用户就无法访问了,那么利用hadoop可以咋样处理这个问题呢?

(1)首先,我们将数据进行切片,将数据分成多片然后放在不同的服务器中。
	HDFS负责通过namecode将数据block在不同的服务器中,然后客户端
	最先访问到的就是namecode,然后才可以访问到datacode。
(2)最后通过MapReduce进行海量数据的计算。

4.MapReduce的计算过程是怎么样的呢?

需要说明的是将所有数据都通过带宽传输然后进行计算是不可能实现的。

(1)map阶段:各个主机在自己的本地将数据分析计算出来
(2)reduce阶段:一台主机负责将map阶段各个主机分析出来的数据进行统计(可以有分成多个reduce)。


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

互联网小熊猫

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值