pyspark总结2——DataFrame
spark的DataFrame与python的DataFrame类似,但是其处理速度远快于无结构的RDD。目录1,创建DataFrame2,查询方法2.1 利用DataFrame API查询2.2 利用SQL查询1,创建DataFrameSpark 2.0 用 SparkSession 代替了SQLContext。各种 Spark contexts,包括:HiveContext, SQLContext, StreamingContext,以及SparkContext 全部合并到了SparkSessi






