hadoop学习笔记-1-背景知识

Hadoop介绍 

Apache™ Hadoop® 是一个高可靠性和高扩展的开源分布式计算软件。

Hadoop 是一个能够对大量数据进行分布式处理的软件框架。但是 Hadoop 是以一种可靠、高效、可伸缩的方式进行处理的。Hadoop 是可靠的,因为它假设计算元素和存储会失败,因此它维护多个工作数据副本,确保能够针对失败的节点重新分布处理。Hadoop 是高效的,因为它以并行的方式工作,通过并行处理加快处理速度。Hadoop 还是可伸缩的,能够处理 PB 级数据。此外,Hadoop 依赖于社区服务器,因此它的成本比较低,任何人都可以使用。

Hadoop是一个能够让用户轻松架构和使用的分布式计算平台。用户可以轻松地在Hadoop上开发和运行处理海量数据的应用程序。它主要有以下几个优点:

⒈     高可靠性。Hadoop按位存储和处理数据的能力值得人们信赖;

⒉     高扩展性。Hadoop是在可用的计算机集簇间分配数据并完成计算任务的,这些集簇可以方便地扩展到数以千计的节点中。

⒊     高效性。Hadoop能够在节点之间动态地移动数据,并保证各个节点的动态平衡,因此处理速度非常快。

⒋     高容错性。Hadoop能够自动保存数据的多个副本,并且能够自动将失败的任务重新分配。

Hadoop是项目的总称,起源于作者儿子的一只玩具大象的名字。主要是由HDFS、MapReduce和Hbase组成。

HDFS是Google File System(GFS)的开源实现。

MapReduce是Google MapReduce的开源实现。

HBase是Google BigTable的开源实现。



Hadoop大事记

  2012年5月2日--来自北京暴风科技股份有限公司( 暴风影音 )的童小军通过认证考试,成为首位在国内完成培训并获得 美国 Cloudera公司认证的Apache Hadoop开发工程师(Cloudera Certified Developer for Apache Hadoop ,CCDH)。
  2012年2月25日- 至今持续建设EasyHadoop开源社区行业技术论坛,带领团队成功组织五次Hadoop技术分享活动,分享Hadoop使用技能。活动受到来自百度、腾讯、新浪、阿里巴巴、蓝讯等的上百位Hadoop工程师广泛参与和支持。
  2012年1月7日 EasyHadoop 社区联合一群hadoop的爱好者,开始建设EasyHadoop开源社区,并在国内普及Hadoop技术应用,致力于让Hadoop大数据分析更简单。
  2011年12月-- Apache Hadoop技术领导者Cloudera公司授予深圳市易思博信息技术有限公司为Apache Hadoop中国区培训合作伙伴,Apache Hadoop技术授权培训认证正式进入中国。
  2009年4月-- 赢得每分钟排序,59秒内排序500 GB(在1400个节点上)和173分钟内排序100 TB数据(在3400个节点上)。
  2009年3月-- 17个集群总共24 000台机器。
  2008年10月-- 研究集群每天装载10 TB的数据。
  2008年4月-- 赢得世界最快1 TB 数据排序 在900个节点上用时209秒。
  2007年4月-- 研究集群达到两个1000个节点的集群。
  2007年1月-- 研究集群到达900个节点。
  2006年12月-- 标准排序在20个节点上运行1.8个小时,100个节点3.3小时,500个节点5.2小时,900个节点7.8个小时。 
  2006年11月-- 研究集群增加到600个节点。
  2006年5月-- 标准排序在500个节点上运行42个小时(硬件配置比4月的更好)。
  2006年5月-- 雅虎建立了一个300个节点的Hadoop研究集群。
  2006年4月-- 标准排序(10 GB每个节点)在188个节点上运行47.9个小时。
  2006年2月-- 雅虎的 网格计算 团队采用Hadoop。
  2006年2月-- Apache Hadoop项目正式启动以支持MapReduce和HDFS的独立发展。
  2006年1月-- Doug Cutting加入雅虎。
  2005年12月-- Nutch移植到新的框架,Hadoop在20个节点上稳定运行。
  2004年-- 最初的版本(现在称为HDFS和MapReduce)由Doug Cutting和Mike Cafarella开始实施。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值