1 读取和保存文件
SparkSQL读取和保存的文件一般为三种,JSON文件、CSV文件和列式存储的文件,同时可以通过添加参数,来识别不同的存储和压缩格式。
本文详细介绍了如何使用SparkSQL进行数据的加载和保存,包括CSV、JSON和Parquet文件的读写,以及如何与MySQL和Hive进行数据交互。通过示例代码展示了读取CSV文件,转换数据并写出为CSV文件,读取和写出JSON及Parquet文件,以及从MySQL和Hive读取数据的过程。
SparkSQL读取和保存的文件一般为三种,JSON文件、CSV文件和列式存储的文件,同时可以通过添加参数,来识别不同的存储和压缩格式。
1642
1015
2958
2240

被折叠的 条评论
为什么被折叠?