Hadoop大数据系列之一---Hadoop架构原理分析

1.单节点体系


2.集群结构分析


3.HDFS架构分析

Hadoop分布式文件系统;

按需定制MapReduce;》大数据量(纯文本)

目标在于多次的文件流读取;》优势在于一次写入,多次读取

写入成本很高;

高度数据冗余(副本,默认3);

每个节点不需要RAID-独立磁盘冗余阵列:redundant array of independent disks;

Blocksize较大(128m);

定制节点的位置感知;

4.NN和DN原生文档解读

NameNode

 1.存储文件元数据,比如目录结构

 2.运行NameNode的服务器至关重要,只有1个

 3.只对元数据的增删做日志记录,不对block和文件流做记录

 4.DataNode故障时,负责创建更多的副本block

HDFS架构



============================================================================================================


DataNode

 1.存储真实数据

 2.可运行在多种文件系统上(ext3/4,NTFS...)

 3.通知NameNode自己有哪些block

 4.NameNode在同一机架创建放置一个副本,另一机架放置2个副本

5.启动脚本分析

HDFS部分

yarn部分




















  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值