Spark-数据加载与数据落地（巩固篇）

open_test01

已于 2023-03-18 16:05:55 修改

阅读量316

点赞数

分类专栏： SparkSQL-巩固篇文章标签： java 开发语言 spark

于 2023-03-17 17:13:35 首次发布

本文链接：https://blog.csdn.net/dafsq/article/details/129623328

版权

SparkSQL-巩固篇专栏收录该内容

11 篇文章 1 订阅

订阅专栏

文章介绍了Spark中创建临时视图的两种类型及其区别，包括全局和局部，以及createTempView和createOrReplaceTempView函数的用法。同时，详细阐述了数据加载的方法，如read.format和read.jdbc，并提到了数据落地的两种方式及对应的write函数用法。

摘要由CSDN通过智能技术生成

关于创建临时视图的区别

## 1. 从范围上说分为带Global和非Global的，带Global代表是当前SparkApplication可用的，而非Global的表示只在当前的SparkSession中可以使用
## 2. 从创建的角度上比较，createTempView,创建临时视图，如果该视图存在就报错。createOrReplaceTempView创建临时视图，如果视图存在就会覆盖之。
createOrReplaceTempView
createTempView 

createOrReplaceGlobalTempView
createGlobalTempView

数据加载

加载数据一般为两种方式：

spark.read.format("xx格式").load("路径")
spark.read.xx格式("路径")

//标准的加载方式：
spark.read.format("数据格式").load(path)
//简写：
spark.read.json("file:///d:/1.json")默认加载parquet

 //读取JDBC操作1
    val df = spark.read.format("jdbc")
        .option("url","jdbc:mysql://master:3306/spark-sql") //路径
        .option("dbtable","user") //指定哪张数据表
        .option("user","root") //指定用户名
        .option("password","p@ssw0rd") //指定密码
        .load() //读取

    //读取JDBC操作2
    val pro = new Properties()
    pro.put("user","root") //指定用户名
    pro.put("password","p@ssw0rd") //指定密码
    //jdbc("路径","表名","Properties对象")
    val df1 = spark.read.jdbc("jdbc:mysql://master:3306/spark-sql","user",pro)

数据落地

数据落地一般都有两种方式：

1、spark.wirte.format("文件格式").mode("存储模式").save("路径")

2、spark.wirte.格式("路径")

标准格式：

df.write.format("text").save("file:///C:\\real_win10\\1.txt")

简写

df.write.text("file:///C:\\real_win10\\1.txt")

open_test01

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录