1.什么是hadoop?
hadoop是一个分布式系统基础架构,由apache基金会开发,用户可以在不了解分布式底层细节的情况下,开发分布式程序。充分利用集群的威力高速运算和存储。
它包括三部分:HDFS,YARN,和MapReduce。
HDFS:Hadoop分布式文件系统
YARN:任务调度和集群资源管理框架。
MapReduce:能够基于YARN并行的处理大规模的数据集。
2.狭义hadoop和广义的hadoop
狭义hadoop:是一个适合大数据分布式存储(HDFS)、分布式计算(MR)和资源调度(YARN)平台。