一、Hadoop是什么
1、Hadoop是Apache旗下的一个用Java语言实现的开源软件,是处理大数据存储和数据计算的分布式架构。
狭义上说Hadoop是指Apache这款开源架构,它的核心组件有:
HDFS:分布式文件系统,解决海量数据的存储
MapReduce:分布式计算框架,解决海量数据的计算
Yarn:作业调度和集群资源管理框架,解决资源调度任务
广义上说Hadoop是指Hadoop生态圈,包含以下组件:
HDFS
MapReduce
Yarn
Hive
一、Hadoop是什么
1、Hadoop是Apache旗下的一个用Java语言实现的开源软件,是处理大数据存储和数据计算的分布式架构。
狭义上说Hadoop是指Apache这款开源架构,它的核心组件有:
HDFS:分布式文件系统,解决海量数据的存储
MapReduce:分布式计算框架,解决海量数据的计算
Yarn:作业调度和集群资源管理框架,解决资源调度任务
广义上说Hadoop是指Hadoop生态圈,包含以下组件:
HDFS
MapReduce
Yarn
Hive