Hadoop 发展过程是怎样的?

作者:禅与计算机程序设计艺术

1.简介

2003年,美国加州大学洛杉矶分校教授李彦宏博士发明了一种分布式文件系统——GFS(Google File System)。由于该文件系统设计得足够简单,可以适应大规模数据集存储需求,在此基础上演化出多种应用,包括MapReduce、BigTable、PageRank等,并成为当时互联网公司的标配技术之一。
2004年,Google发布了第一版Hadoop项目,定位是一个“框架”,并提供了计算集群管理、存储、数据处理和分析功能。到了2010年,Hadoop已经成为最流行的大数据开源技术之一。它既有优秀的性能,又具有稳健、可靠的数据存储能力。
2011年,微软提出Spark,宣称将基于内存的快速计算框架作为主要特性,打造出一个更具弹性的分布式数据处理平台。而Facebook、百度等互联网巨头也纷纷推出自己的分布式存储和分析系统。
2014年,Twitter开源自己的分布式日志收集系统Flume,其后被大量应用于各种大数据场景中。此外,Facebook最新发布的基于Hadoop的通用计算框架Pegasus也取得了惊喜之举。
2015年至今,Hadoop已经成为大数据领域里最重要的组件,目前仍然处于蓬勃发展的阶段。

本文要介绍的Hadoop的发展过程主要围绕三个方面:基础设施建设、生态系统构建和技术革新。首先,我们将会对Hadoop项目起源的历史进行简要回顾,然后介绍HDFS(Hadoop Distributed File System)项目的全貌,同时展开介绍MapReduce和Flume等重要项目的一些相关技术。接着,我们详细地介绍了YARN(Yet Another Resource Negot

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

禅与计算机程序设计艺术

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值