Apache Spark是针对Hadoop数据的一个功能强大的开源处理引擎,它是围绕速度,易用性以及复杂分析而建立的。它最初由UC Berkeley的AMPLab开发,后来提交到了Apache软件基金会。
Apache Spark基本上是一个并行数据处理框架,它可以和Apache Hadoop协同并让开发工作变得更加快速、容易。Spark可以让大数据与快数据应用结合在一起,可以通过流数据处理让所有的数据进行交互式分析。
参考
http://www.searchdatabase.com.cn/showcontent_84743.htm