JSON文件
Spark SQL 能够自动推测 JSON数据集的结构,并将它加载为一个Dataset[Row]. 可以通过SparkSession.read.json()去加载一个 一个JSON 文件。
注意:这个JSON文件不是一个传统的JSON文件,每一行都得是一个JSON串。格式如下:
{“name”:”Michael”}
{“name”:”Andy”, “age”:30}
{“name”:”Justin”, “age”:19}
1)导入隐式转换
import spark.implicits._
2)加载JSON文件
val path = “examples/src/main/resources/people.json”
val peopleDF = spark.read.json(path)
3)创建临时表
peopleDF.createOrReplaceTempView(“people”)
4)数据查询