ScalaSQL篇

最新推荐文章于 2024-06-10 09:38:52 发布

TGKD DFN

最新推荐文章于 2024-06-10 09:38:52 发布

阅读量651

点赞数

文章标签：大数据 scala spark

本文链接：https://blog.csdn.net/qq_59336423/article/details/125579149

版权

IDEA 开发 SparkSQL

添加依赖

<dependency>
        <groupId>org.apache.spark</groupId>
        <artifactId>spark-sql_2.12</artifactId>
        <version>3.0.0</version>
</dependency>

代码实现

package com.atguigu.bigdata.spark.sql

import javafx.scene.input.DataFormat
import org.apache.spark.SparkConf
import org.apache.spark.rdd.RDD
import org.apache.spark.sql.{DataFrame, Dataset, Row, SparkSession}

object Spark01_SparkSQL_Basic {
  def main(args: Array[String]): Unit = {
    //创建上下文环境配置对象
    val sparkConf = new SparkConf().setMaster("local[*]").setAppName("SparkSQL")
    val spark = SparkSession.builder().config(sparkConf).getOrCreate()
    import spark.implicits._
//    val df:DataFrame = spark.read.json("E:/IDEA 2021/works/atguigu-classes/datas/user.json")

//    df.show()

//    df.create

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

TGKD DFN

关注关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
ScalaSQL篇

IDEA 开发 SparkSQL添加依赖代码实现UDAF强类型的 Dataset 和弱类型的 DataFrame 都提供了相关的聚合函数，如 count()，countDistinct()，avg()，max()，min()。除此之外，用户可以设定自己的自定义聚合函数。通过继承 UserDefinedAggregateFunction 来实现用户自定义弱类型聚合函数。从 Spark3.0 版本后，UserDefinedAggregateFunction 已经不推荐使用了。可以统一采用强类型聚
复制链接

扫一扫