spark-14.sparkSQL_5_sparkSQL的输入、输出

最新推荐文章于 2023-04-30 17:25:45 发布

蒙面小生

最新推荐文章于 2023-04-30 17:25:45 发布

阅读量206

点赞数

分类专栏： Spark 文章标签： spark sparkSQL

本文链接：https://blog.csdn.net/qq_30657195/article/details/106972989

版权

Spark 专栏收录该内容

34 篇文章 2 订阅

订阅专栏

1.输入

高级模式：

spark.read.json(path)
			jdbc
			csv
			parquet //默认格式，列存储格式，hive。
			orc
			table
			text
			textFile

低级模式：

spark.read.format(“json”).load(path)

如果不指定format，默认是parquet格式。

2.输出

高级模式：

dataFrame/dataSet. json(path)
				jdbc
				csv
				parquet //默认格式，列存储格式，hive。
				orc
				table
				text
				textFile

低级模式：

dataFrame/dataSet.write.format(“jdbc”).参数.mode(saveMode).save

saveMode的类型：
Specifies the behavior when data or table already exists. Options include:

SaveMode.Overwrite: overwrite the existing data.
SaveMode.Append: append the data.
SaveMode.Ignore: ignore the operation (i.e. no-op).
SaveMode.ErrorIfExists: default option, throw an exception at runtime.

关系型数据库的读写：
1.保存mysql

dataFrame.write.format(“jdbc”)
.option(“url”,”jdbc:mysql://master:3306/rdd”)
.option(“dbtable”,”rddtable10”)
.option(“user”,”root”)
.option(“password”,”123456”)
.mode(“overwrite”)
.save()

2.读入到spark

val data = spark.read.format(“jdbc”)
.option(“url”,”jdbc:mysql://master:3306/rdd”)
.option(“dbtable”,”rddtable10”)
.option(“user”,”root”)
.option(“password”,”123456”)
.load()

蒙面小生

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
spark-14.sparkSQL_5_sparkSQL的输入、输出

1.输入高级模式：spark.read.json(path) jdbc csv parquet //默认格式，列存储格式，hive。 orc table text textFile低级模式：spark.read.format(“json”).load(path) 如果不指定format，默认是parquet格式。2.输出高级模式：dataFrame/dataSet. json(path) jdbc csv parquet
复制链接

扫一扫

专栏目录