1.Hadoop是什么?
Hadoop是一个开源的大数据框架,是一个分布式计算的解决方案
Hadoop=HDFS(分布式文件系统)+ MapReduce(分布式计算)
可以用来搭建大型数据仓储,实现PB级的数据存储、处理、分析、统计等业务
2.Hadoop的核心?
- HDFS分布式文件系统:存储是大数据的基础,存储海量的数据
- MapReduce编程模型:分布式计算是大数据应用的解决方案,并行处理框架,实现任务分解和调度。
Hadoop是一个开源的大数据框架,是一个分布式计算的解决方案
Hadoop=HDFS(分布式文件系统)+ MapReduce(分布式计算)
可以用来搭建大型数据仓储,实现PB级的数据存储、处理、分析、统计等业务