spark sql本地测试Demo

spark 本地测试Demo

    import org.apache.spark.sql.SparkSession
    import org.apache.spark.sql.functions._
    // 创建SparkSession
    val spark = SparkSession.builder().master("local[*]").getOrCreate()
    import spark.implicits._
    // 创建示例数据集
    val data = Seq(("Alice", "Apple"),
      ("Bob", "Banana"),
      ("Charlie", "Cherry"),
      ("Alice", "Apricot"),
      ("Alice", "Avocado"))

    val df = spark.createDataFrame(data).toDF("name", "fruit")

    // 使用Spark SQL进行查询
    df.createOrReplaceTempView("fruits_table")
    val result = spark.sql("SELECT name, collect_set(fruit) AS fruits FROM fruits_table GROUP BY name")
      .withColumn("contains_apple", array_contains(col("fruits"), "Apple"))

    result.show()
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值