工业大数据漫谈13：Hadoop在工业大数据中的作用

最新推荐文章于 2022-08-26 16:30:49 发布

VIP文章 qunqun8889

最新推荐文章于 2022-08-26 16:30:49 发布

阅读量392

点赞数

分类专栏：大数据文章标签：大数据 Hadoop

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qunqun8889/article/details/103490279

版权

现在，一谈到大数据的技术，Hadoop都是绕不开的话题，似乎在项目中不使用Hadoop或者类似的分布式数据库技术，就不是大数据应用。那么，到底在工业大数据应用中，没有没必要使用Hadoop，或者在什么样的应用环境中使用Hadoop才是适合的呢？

首先，让我们来看一看Hadoop是什么，它是为解决什么问题而发展起来的。

简单说，Hadoop是一个能够对大量数据进行分布式处理的软件框架。它包含众多的应用，其最核心的是分布式文件系统HDFS（Hadoop Distributed FileSystem）、分布式计算框架MapReduce。2003年Google发表了一篇技术学术论文详细讲解了谷歌文件系统（GFS），2004年Google又发表了一篇技术学术论文讲解了MapReduce。2004年Nutch创始人Doug Cutting基于Google的GFS论文实现了分布式文件存储系统名为NDFS。2005年Doug Cutting又基于MapReduce，在Nutch搜索引擎实现了该功能。2006 年，Apache将Map/Reduce 和 Nutch Distributed FileSystem (NDFS) 分别被纳入称为 Hadoop 的项目中。从此，Hadoop作为开源界的分布式大数据处理框架开始迅速流行起来。

Hadoop除了核心HDFS和MapReduce外，还有许多实现具体应用的子项目，其核心组件如下图所示：

最低0.47元/天解锁文章

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
工业大数据漫谈13：Hadoop在工业大数据中的作用

现在，一谈到大数据的技术，Hadoop都是绕不开的话题，似乎在项目中不使用Hadoop或者类似的分布式数据库技术，就不是大数据应用。那么，到底在工业大数据应用中，没有没必要使用Hadoop，或者在什么样的应用环境中使用Hadoop才是适合的呢？首先，让我们来看一看Hadoop是什么，它是为解决什么问题而发展起来的。简单说，Hadoop是一个能够对大量数据进行分布式处理的软件框架。它包含众多...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。