fe 缺点 不方便添加新的优化策略 线程安全问题 Spark SQL支持三种语言 java Scala python DataFrame 大规模数据化结构能历、提高了运算能力 从sql到dataFrame的转化,支持sql查询 RDD是分布式的java对象的集合,对象颞部结构不可知 dataframe以rdd为基础的分布式数据集,提供了详细的结构信息