2. 读取Json文件创建DataFrame
- 数据文件
spark安装包自带不通格式的数据,我们去spark包里面找json文件
/export/servers/spark/example/src/main/resourcces/people.json
- 在spark shell执行下面命令,读取数据
这里我们使用通过SparkSession构建DataFrame
val jsonDF = spark.read.json("file:///export/servers/spark/examples/src/main/reesources/people.json")
- 接下来就可以使用DataFrame的函数操作
jsonDF.show
jsonDF.printSchema