大数据Haddop学习（最详细的环境配置，保证成功！）（一）

最新推荐文章于 2022-09-22 18:31:19 发布

Jecky不姓码

最新推荐文章于 2022-09-22 18:31:19 发布

阅读量400

点赞数

分类专栏：大数据实践学习(小白归纳) 文章标签：大数据 hadoop环境配置学习大数据大数据入门

本文链接：https://blog.csdn.net/weixin_29057619/article/details/101347086

版权

大数据

辛苦整理，未经允许，严禁转载！

大数据的一些术语：杀生，大数据杀熟，用的旧的一些数据来分析你行为。
人工智能：模型 + 训练
5G：IT界推动VR开始发展，试水区，医疗事业

创始人：Doug Cutting（核心人物）和Mike Caferalla
在2002年，doug和mike设计搜索引擎Nutch，爬取了全网10亿个网页的数据，考虑如何存储这些数据
在2003年，Google发表了一篇论文《The Google FileSystem》(GFS)阐述了分布式存储的原理，但是Google并没有对外公开该框架的使用。Doug就根据这篇论文实现了NDFS（Nutch Distributed FileSystem）
在2004年，Google发表了一篇论文《The Google MapReduce》阐述了理想分布式计算的思想，同样Google依然没有对外公开框架，Doug又根据这篇论文实现了Nutch中的MapReduce
在Nuch8.0版本的时候，将DNFS和MapReduce从Nutch中分离出来形成了Hadoop，同时NDFS更名为HDFS
在2007，Doug从原公司离职，同年11月，Doug入职了Yahoo
在Yahoo工作期间，又参与实现了HBase，Pig等
Yahoo将Hadoop，HBase，Pig等框架都贡献给了Apache

Hadoop

关注

专栏目录