Hadoop生态圈

最新推荐文章于 2024-09-11 22:16:31 发布

奇妙汉饱饱

最新推荐文章于 2024-09-11 22:16:31 发布

阅读量134

点赞数 2

文章标签： hadoop 大数据分布式

本文链接：https://blog.csdn.net/2401_83287873/article/details/136546843

版权

本文介绍了Hadoop的两部分含义：狭义上的Hadoop项目，包含HDFS、MapReduce和YARN；以及广义的大数据生态圈，涵盖了HBase、Hive等众多相互依赖的开源组件。

摘要由CSDN通过智能技术生成

我们通常说到的hadoop包括两部分，一是Hadoop核心技术（或者说狭义上的hadoop），对应为apache开源社区的一个项目，主要包括三部分内容：hdfs，mapreduce，yarn。其中hdfs用来存储海量数据，mapreduce用来对海量数据进行计算，yarn是一个通用的资源调度框架（是在hadoop2.0中产生的）。

另一部分指广义的，广义上指一个生态圈，泛指大数据技术相关的开源组件或产品，如hbase、hive、spark、pig、zookeeper、kafka、flume、phoenix、sqoop等。

生态圈中的这些组件或产品相互之间会有依赖，但又各自独立。比如habse和kafka会依赖zookeeper，hive会依赖mapreduce。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

奇妙汉饱饱

关注关注

2
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Hadoop生态圈

我们通常说到的hadoop包括两部分，一是Hadoop核心技术（或者说狭义上的hadoop），对应为apache开源社区的一个项目，主要包括三部分内容：hdfs，mapreduce，yarn。另一部分指广义的，广义上指一个生态圈，泛指大数据技术相关的开源组件或产品，如hbase、hive、spark、pig、zookeeper、kafka、flume、phoenix、sqoop等。比如habse和kafka会依赖zookeeper，hive会依赖mapreduce。
复制链接

扫一扫