Hadoop概述

Hadoop是Apache的开源分布式存储和计算平台,起源于Apache Nutch项目,解决大数据存储和处理问题。Hadoop发展至今已成为众多公司如雅虎、Facebook等的选择,其生态系统包括Hbase、Hive、Spark等组件,提供数据仓库、快速计算和分布式协调服务。
摘要由CSDN通过智能技术生成

1 Hadoop的简要介绍

Hadoop是Apache基⾦会旗下⼀个开源的分布式存储和分析计算平台,使⽤java语言开发,具有很好的跨平台性,可以运⾏在商⽤(廉价)硬件上,⽤户⽆需了解分布式底层细节,就可以开发分布式程序,充分使⽤集群的⾼速计算和存储。

Apache lucene是⼀个应⽤⼴泛的⽂本搜索系统库。该项⽬的创始⼈道格·卡丁在2002 年带领团队开发该项⽬中的⼦项⽬Apache Nutch,想要从头打造⼀个⽹络搜索引擎系 统,在开发的过程中,发现了两个问题,⼀个是硬件的⾼额资⾦投⼊,另⼀个是存储问 题。

2003年和2004年Google先后发表的《GFS》和《MapReduce》论⽂,给这个团队提供了灵感,并进⾏了实现,于是NDFS(Nutch分布式⽂件系统)和MapReduce相继问世。 2006年2⽉份,开发⼈员将NDFS和MapReduce移出Nutch形成⼀个独⽴的⼦项⽬,命名为Hadoop(据Doug Cutting所说,该名字是借⽤了他的孩⼦给⽑绒玩具取的名字)。

 2 Hadoop的发展历史

- 起源于Apache Nutch项⽬(⼀个网页爬取⼯具和搜索引擎系统,后来遇到大数据量的网页存储问题)

- 2003年,⾕歌发表的⼀篇论⽂(描述的是“⾕歌分布式⽂件系统”,简称GFS),给了Apache Nutch项⽬的开发者灵感

- 2004年,Nutch的开发者开始着⼿NDFS(Nutch的分布式⽂件系统) - 2004年,⾕歌⼜发表了⼀篇介绍MapReduce系统的论⽂

- 2005年,Nutch

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Oak-Komorebi

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值