Hadoop生态圈普及
大数据一路走来,从最开始的Hadoop1.0 逐渐发展到Hadoop2.0。Hadoop的横空出世引领了大数据行业技术的发展。逐渐以分布式并行离线处理框架MapReduce、分布式文件存储系统HDFS以及调度系统YARN为中心,发展出庞大的生态圈,比如Hive、HBase、Zookeeper等等,丰富健全了最开始的大数据技能系统。随着大数据技术的发展,又开发引进了以Spark为核心的处理体系,列式数据库Kudu、多维分析引擎Druid、Kylin等等,更加丰富了这个庞大的生态圈,对于数据的分...







