Hadoop

Hadoop是Apache开源组织的一个分布式计算框架,可以在大量廉价的硬件设备组成的集群上运行应用程序,为应用程序提供了一组稳定可靠的接口,旨在构建一个具有高可靠性和良好扩展性的分布式系统Hadoop9个子项目组成,组织结构如表1所示。

表1 Hadoop组织结构表

Pig

Chukwa

Hive

HBase

MapReduce

HDFS

ZooKeeper   

Common

Avro

Hadoop9个子项目的描述如表2所示。

表2 Hadoop项目描述表

子项目名称

用途

Common

Hadoop项目的核心,是体系最底层的一个模块。为Hadoop各子项目提供各种工具,如:配置文件和日志操作等。

Avro

HadoopRPC(远程过程调用)项目,类似GoogleprotobufFacebookthrift

Chukwa

管理大型分布式系统的数据采集系统,由yahoo贡献。

HBase

支持结构化数据存储的分布式数据库,是Bigtable的开源实现。

HDFS

分布式文件系统,是分布式计算存储基础。HDFS具有高容错性,可以部署在廉价的硬件设备上,适合有大数据集成的应用,并且提供了对数据读写的高吞吐率。

Hive

提供数据摘要和查询功能的数据仓库。Hive提供了一套以SQL为基础的查询语言。

MapReduce

大型数据的分布式处理并行计算编程模型,是GoogleMapReduce的开源实现。

Pig

PigSQL-like语言是在MapReduce上构建的一种高级查询语言,是Sawzall的开源实现yahoo贡献

ZooKeeper

针对大型分布式系统的可靠协调系统,用于解决分布式系统中一致性问题,是Chubby的开源实现。ZooKeeper提供的功能包括:配置维护、名字服务、分布式同步、组服务等ZooKeeper的目标就是封装好复杂易出错的关键服务,将简单易用的接口和性能高效、功能稳定的系统提供给用户。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值