Hadoop和Spark的联系和区别 计算数据存储位置 Hadoop:硬盘Spark:内存 计算模型 Hadoop:单一Spark:丰富 处理方式 Hadoop:非迭代Spark:迭代 场景要求 Hadoop:离线批处理。(面对SQL交互式查询、实时处理及机器学习等需要和第三方框架结合。多种数据格式转换,导致消耗大量资源)Spark:批处理、实时处理