Hadoop入门第一天

今天很高兴能够开始这个专题,从此就要了解一下BigData领域的东西了,看到下面这个截图,

开心的像个孩子一样,加油,跟着carry来一步一步探索大数据的神秘面纱吧。

1.从Hadoop框架讨论大数据生态

1.1 Hadoop到底是个什么东西

1.2 Hadoop的三大发行版本

Hadoop三大发行版本:Apache、Cloudera、Hortonworks。

Apache版本最原始(最基础)的版本,对于入门学习最好。

Cloudera内部集成了很多大数据框架。对应产品CDH。

Hortonworks文档较好。对应产品HDP。

1.3Hadoop的优势

1.4Hadoop的组成

1.4 Hadoop的架构概述

  1NameNode(nn):存储文件的元数据,如文件明,文件目录结构,文件属性(生成时间,副本数,文件权限)

以及每个文件的块列表和块所在的DataNode等

2.DateNode(dn):在本地文件系统存储文件块数据,以及块数据的校验和

3.Second NameNode(2nn):每隔一段时间对NameNode元数据备份

1.5 Yarn架构概述

1.6MapReduce架构概述

MapReduce将计算过程分为两个阶段:Map和Reduce

1)Map阶段并行处理输入数据

2)Reduce阶段对Map结果进行汇总

这些就是Hadoop的架构的简单介绍,Hadoop的搭建我这边就不再总结了(这其实是自学大数据最重要的一步,多少人想自学大数据都是走到这一步就放弃了),反正我是比着文档搭建好了,有需要的可以联系我,我给你文档。

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值