Spark概念
Spark最初由美国加州伯克利大学的AMP实验室于2009年开发,是基于内存计算的大数据并行计算框架,可用于构建大型的、低延迟的数据分析应用程序。
Spark与Hadoop比较
1、基于内存计算。先进有向无循环图DAG执行引擎。
2、简洁的API设计有助于用户轻松构建并行程序
Spark与Hive的比较
https://www.cnblogs.com/sky-chen/p/10046888.html
Spark参考书推荐
https://www.zhihu.com/question/23655827/answer/690033578
https://china-testing.github.io/spark_books.html