spark的DataFrame常用操作
DSL风格语法
personDF.show
personDF.select(personDF.col("name")).show
personDF.select(col("name"), col("age")).show
personDF.select("name").show
personDF.printSchema
personDF.select(col("id"), col("name"), col("age") + 1).show
personDF.select(personDF("id"), personDF("name"), personDF("age") + 1).show
personDF.filter(col("age") >= 18).show
personDF.groupBy("age").count().show()
SQL风格语法
- 如果想使用SQL风格的语法,需要将DataFrame注册成表
personDF.registerTempTable("t_person")
sqlContext.sql("select * from t_person order by age desc limit 2").show
sqlContext.sql("desc t_person").show