Cross-Platform Resource Scheduling for Spark and MapReduce on YARN论文理解
Cross-Platform Resource Scheduling for Spark and MapReduce on YARN论文理解
摘要
MapReduce不能有效的处理大数据的非批处理过程(例:交互式作业,实时查询和流计算);新兴的Apache Spark则可以处理这一过程,Spark可以在已建立的Hadoop集群上运行并利用现有的HDFS。
在YARN上部署Spark的三个主要...
原创
2018-09-14 20:57:30 ·
577 阅读 ·
0 评论