Scala将两个相同列名的表进行合并

最新推荐文章于 2023-02-25 09:32:03 发布

nsq_ai

最新推荐文章于 2023-02-25 09:32:03 发布

阅读量730

点赞数

分类专栏： SparK学习和总结

本文链接：https://blog.csdn.net/weixin_45063703/article/details/121164295

版权

scala spark hive

SparK学习和总结专栏收录该内容

25 篇文章 2 订阅

订阅专栏

前言

将两个相同列名的表进行合并，
采用 unionByName:合并时按照列名进行合并，而不是位置

程序

import org.apache.spark.sql.SparkSession


object test_unionbyname {

  val isLocal = true
  def main(args: Array[String]): Unit = {

    val spark = apply (this.getClass.getSimpleName,isLocal)

    import spark.implicits._

    val df_table1 = spark.createDataFrame(List(
      ("nian", 23),
      ("li", 24)))
      .toDF("name", "age")
    df_table1.show()
    val df_table2 = spark.createDataFrame(List(
      ("ni", 32),
      ("dang", 42)))
      .toDF("name", "age")
    df_table2.show()

    val df_res = df_table1.unionByName(df_table2)
    df_res.show

  }
  def apply(appName: String = "SPARK",isLocal: Boolean = true): SparkSession = {

    val sparkBuilder = SparkSession.builder().appName(appName)

    if (isLocal){
      sparkBuilder.master("local[*]")
    }
    //    else {
    //      sparkBuilder.master("yarn")
    //    }


    //    if(executors > 0){
    //      sparkBuilder.config("spark.executor.instances", executors)
    //    }

    val spark = sparkBuilder
      .config("spark.yarn.maxAppAttempts", 1)
      .config("spark.sql.sources.partitionOverwriteMode","dynamic")
      .config("spark.sql.hive.convertMetastoreParquet","false")
      .config("hive.exec.dynamic.partition.mode", "nonstrict") // 非严格模式
      .enableHiveSupport()
      .getOrCreate()

    //      .config("spark.speculation",false)
    //    spark.conf.getAll.foreach(println(_))
    spark.sparkContext.setLogLevel("Error")
    spark
  }

}

结果展示

+----+---+
|name|age|
+----+---+
|nian| 23|
|  li| 24|
+----+---+

+----+---+
|name|age|
+----+---+
|  ni| 32|
|dang| 42|
+----+---+

+----+---+
|name|age|
+----+---+
|nian| 23|
|  li| 24|
|  ni| 32|
|dang| 42|
+----+---+

nsq_ai

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
Scala将两个相同列名的表进行合并

前言将两个相同列名的表进行合并，采用 unionByName:合并时按照列名进行合并，而不是位置程序import org.apache.spark.sql.SparkSessionobject test_unionbyname { val isLocal = true def main(args: Array[String]): Unit = { val spark = apply (this.getClass.getSimpleName,isLocal) imp
复制链接

扫一扫