spark重要概念提出流程 1.0版本提出:sparkSQL 1.2版本之前:schemaRDD 1.3版本之后:DataFrame, 进化原因:面向oo和结构化编程(structure) 1.6版本推出:Dataset 变更原因:编译时的类型安全,(compile-time type safety) 优化 目的是把错误在编译时就发现,而不是运行时 (将运行时错误转换成编译时错误) 后期还有补充