(1)创建json的RDD文件,路径文件名不能以数据开头(\会作为转义字符,需要将路径中的\进行转义)
strjson=sc.parallelize(“**”)(或者strjson=sc.textFile(E:\data.txt))
(2)创建dataFrame
Swimjson=spark.read.json(strjson)
(3)创建临时表括号中的为表名
Swimjson.createOrReplaceTempView(“dataframe”)
(4)查询dataFrame
Swimjson.show()
(5)使用sql查询
spark.sql(“select * from dataframe”).collect()