Spark Sql教程(4）——全局临时表和局部临时表

最新推荐文章于 2024-05-28 08:00:00 发布

辜智强 -buaa

最新推荐文章于 2024-05-28 08:00:00 发布

阅读量9.4k

点赞数

本文链接：https://blog.csdn.net/m0_37719047/article/details/89919529

版权

SparkSession的临时表分为两种

全局临时表：作用于某个Spark应用程序的所有SparkSession会话
局部临时表：作用于某个特定的SparkSession会话

如果同一个应用中不同的session需要重用一个临时表，那么不妨将该临时表注册为全局临时表，可以避免多余的IO，提高系统的执行效率，但是如果只是在某个session中使用，只需要注册局部临时表，可以避免不必要的内存占用

package sparksql

import org.apache.spark.sql.SparkSession

object SparkSqltest1 {

  def main(args: Array[String]): Unit = {
    //创建sparksession
    val   sparkSession=SparkSession.builder().appName("test1").master("local[*]")getOrCreate()
    import  sparkSession.implicits._
    //读取文件形成dataframe
    val   df=sparkSession.read.json("hdfs://192.168.1.181:9000/json/data.json")
    val   temp=df.createTempView("temp_person")   //局部变量表
    sparkSession.sql("select  *  from  temp_person").show()
    val   glob=df.createGlobalTempView("glob_person")   //全局变量表
    sparkSession.sql("select  *  from  glob_person").

最低0.47元/天解锁文章

辜智强 -buaa

关注

0
点赞
踩
13

收藏

觉得还不错? 一键收藏
0
评论
Spark Sql教程(4）——全局临时表和局部临时表

SparkSession的临时表分为两种全局临时表：作用于某个Spark应用程序的所有SparkSession会话局部临时表：作用于某个特定的SparkSession会话如果同一个应用中不同的session需要重用一个临时表，那么不妨将该临时表注册为全局临时表，可以避免多余的IO，提高系统的执行效率，但是如果只是在某个session中使用，只需要注册局部临时表，可以避免不必要的内存占用...
复制链接

扫一扫