Apache Hadoop 项目介绍

 

Apache Hadoop 项目开发的开源软件提供了可靠、可伸缩、分布式的计算。它是Google类似技术的开源版本。使用Hadoop的公司有Yahoo!, Facebook, Twitter, IBM等。

为什么要开发这样的系统呢?“When data exists in this quantity (terabit/day or petabit/day), one of the processing limitations is that it takes a significant amount of time to move the data. Apache Hadoop has emerged to address these concerns with its unique approach of moving the work to the data and not the other way around.” 简单翻译就是,当数据量非常庞大的时候,移动数据时间也非常庞大。为了处理这个挑战,Hadoop采用将数据处理工作移动到数据处而不是反向移动的方式。

Hadoop 包括如下的子项目:

  • Hadoop Common : 项目共用软件包
  • Chukwa : 数据收集系统以管理大型分布式系统
  • HBase : 可伸缩、分布式、结构化数据库
  • HDFS : 分布式文件系统
  • Hive : 数据仓库以提供数据整合以及ad hoc查询
  • MapReduce : 分布式大型数据处理软件框架
  • Pig : 数据流语言以及平行化执行框架
  • ZooKeeper : 为分布式应用程序提供高性能协调服务

 

Hadoop的工作原理可以用下面的图简单描述:Hadoop

还有很多基于Hadoop开发的项目:

如果你想进一步了解Hadoop,《Hadoop权威指南(中文版)》将是你第一选择了,它是Hadoop的开发者写的,所以相当的权威性。Hadoop

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值