Hadoop十岁了,核心代码行数已170万+、贡献者800+

       Hadoop正式诞生于2006年1月28日,它是一个开源项目的生态系统,从根本上改变了企业存储、处理和分析数据的方式。跟传统系统的区别是,Hadoop可以在相同的数据上同时运行不同类型的分析工作。

  自2006年2月项目正式启动,短短的十年间,Hadoop逐步发展成为最近十年来最成功的开源社区的历程。

  核心Hadoop中目前的代码行数:170万+

  自2006年来对Hadoop的提交数量:12000+

  自2006年来对核心Hadoop的代码贡献者:800+

  Hadoop生态系统中的项目数量从2006年的2个到了25个

  总有那些时间节点事件让你难以忘却:

  2006年1月,Hadoop之父Doug Cutting加入雅虎;

  2006年1月,Cutting将Hadoop代码从Nutch中剥离作为一个新的子项目(常被称作Hadoop“创世纪”事件);

  2006年3月,Yahoo!创建了其第一个Hadoop研究集群;

  Google发布了最初的BigTable论文《Cutting:用于结构化数据的一个分布式存储系统》,启发了Hbase的创建;

  2008年1月,Hadoop成为了Apache顶级项目;

  2008年7月,Hive,第一个Hadoop的SQL访问框架(由Facebook发明),成为一个新的Hadoop子项目;

  2008年8月,Apache的Pig发布,第一个Hadoop的高级别非SQL框架;

  2010年5月,Hbase,自HDFS以来第一个新的数据存储项目,成为Apache顶级项目;

  2012年3月,HDFS HA,做为企业级应用的重要一步,并入了Hadoop支干项目;

  2012年8月,YARN(也是企业级应用的重要里程碑)成为Hadoop的子项目;

  2014年1月,Apache Spark,Hadoop新兴的默认执行引擎(MapReduce的补充),成为Apache的顶级项目;

  2015年10月,Kudu,自HBase以来第一个新的Hadoop存储项目,加入了生态系统;

  2015年11月,Impala和Kudu成为Apache孵化项目;

  

 

  如今,Hadoop已被公认为是目前最流行的大数据处理平台。Hadoop生态圈的各个项目,围绕着大数据的存储、计算、分析、展示、安全等各个方面,构建了一个完整的大数据生态系统,如今HDFS、YARN等项目更成为海量数据存储和计算资源调度上的事实标准。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值