002_看大纲_hadoop大纲

002_看大纲_hadoop大纲

通过前面一节可以了解一个大概,知道云计算的含义和hadoop的生态体系

知识链接:001_扎马步_初识hadoop 

Hadoop有两大部分:HDFS+MapReduce

其中HDFS实现分布式存储的底层支持,Mapreduce来实现分布式并行计算。

HDFS采用主从结构模型。一个master,若干个slave。对应到集群中由一个NameNode和若干个DataNode组成。其中NameNode作为主服务器管理文件系统的命名空间和客户端对文件的访问。DateNode负责保存数据。为了增加HDFS的安全性,Hadoop采用了备份的方式,默认将同一个文件会保存3份。后面在介绍HDFS时会说明。

MapReduce是一种并行编程模式。可以同时在上千台计算机中运行。MapReduce框架是由一个单独运行在主节点的JobTracker和运行在每个集群从节点的TaskTracker共同组成。主节点负责调度构成一个作业的所有任务。TaskTracker负责执行任务。(一个JobTracker对应N个TaskTracker)

master--NameNode--JobTracker

slave--DataNode--TaskTracker

是不是对应起来很完美

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值