hadoop一些概念基础

job:

在hadoop里,需要运行一个map/reduce程序的所有JAR文件和类的联合,成为job。所有这些组建被集成在一个成为job文件   的JAR里面。要执行一个job,需要先把它提交到JobTracker。命令如下:

     hadoop   jar  your-job-file-goes-here.jar

Task:

一个job描述了所有输入、输出和一个map/reduce程序里用到的类和库,而一个task是执行单独的map和reduce步骤的程序,他们在JobTracker选择的TaskTracker节点上执行。

HDFS:

 即Hadoop分布式文件系统,他是Hadoop程序的输入和输出文件的通常存储系统。HDFS的主要优势在于他提供了非常高的输入输出速度。这对于一个并行程序的高性能来讲非常关键,因为一项问题工作的处理器数量增加时,输入数据的全部请求和产生的输出的总速率都会增加,HDFS提供了非常高的宽带来存储整个hadoop集群里零散的文件块,通过运行单独的task时精巧的选择,并且因为文件被存储在多个地方,task被放置在临近输入数据的地方,输出数据被大量 存储在最初的地方,一个HDFS群集是建立在一个NameNode和一个或者多个DataNode实例之上。

 

转载于:https://www.cnblogs.com/bokun-wang/archive/2011/12/15/2288353.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值