一、说说Hadoop1.X和hadoop2.X的区别?
答:2.x提出了YARN,这个YARN既可以支持Hadoop的MapReduce,还可以支持其他计算引擎如Spark,Flink,成为一个一站式的资源调度的平台了。
二、说一下Hadoop?(讲个两分钟?)
答:Hadoop是Apache的一款开源框架,有三个核心组件:
- 分布式文件系统 HDFS:用来海量存储
- 作业调度和集群资源管理框架 YARN :解决资源任务调度
- 分布式运算编程框架 MAPREDUCE:海量计算
除此之外,Hadoop还有易扩展,成本低,高可靠的特点。