Hadoop入门笔记

Hadoop基础

Hadoop= HDFS+MapReduce

  • HDFS:分布存储
  • MapReduce:分布计算

HDFS

基本架构: 数据块 NameNode DataNode
NameNode:所有数据块的存储位置信息
DataNode:存放数据块
数据块:Hadoop中数据的存储单元
在这里插入图片描述

DataNode-2,-3均为-1的备份 备份二次
**流程**
  1. 客户端向NameNode发送写请求
  2. NameNode询问DataNode相关的存储信息并与块大小信息一起返回给Client
  3. Client同通过2.返回的信息将数据分块并向DataNode指定位置写入数据
  4. DataNode自动完成两次备份
  5. DataNode向NameNode发送信息,更新NameNode里的数据
  6. NameNode通知Client已经存储完成(后面的分块从2开始)

在这里插入图片描述
流程

  1. 客户端向NameNode发送读请求
  2. NameNode返回Client要求的数据块的位置信息
  3. Client同通过2.返回的信息访问DataNode相关节点
  4. DataNode向Client传输信息
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值