SparkSQL自定义聚类函数

最新推荐文章于 2023-08-17 09:40:31 发布

阿三的学习之路

最新推荐文章于 2023-08-17 09:40:31 发布

阅读量269

点赞数 1

文章标签： spark 大数据

本文链接：https://blog.csdn.net/Alanyungz/article/details/107642607

版权

数据：

user.json
{"id":1,"name":"zhangsan","age":10}
{"id":2,"name":"lisi","age":30}
{"id":3,"name":"wangwu","age":20}
{"id":4,"name":"liuliu","age":40}

需求：统计以上文件的平均年龄

工具：idea

语言：Scala

代码：

package com.test

import org.apache.spark.SparkConf
import org.apache.spark.sql.{Row, SparkSession}
import org.apache.spark.sql.expressions.{MutableAggregationBuffer, UserDefinedAggregateFunction}
import org.apache.spark.sql.types.{DataType, DoubleType, LongType, StructType}

object SparkUDAF {
  def main(args: Array[String]): Unit = {
    val conf  = new SparkConf().setAppName("SparkUDAF").setMaster("local[*]")
    val sparkSession = SparkSession.builder().config(conf).getOrCreate()
    // 创建dataFrame
    val dataFrame = sparkSession.r

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

阿三的学习之路

关注关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
SparkSQL自定义聚类函数

数据：user.json{"id":1,"name":"zhangsan","age":10}{"id":2,"name":"lisi","age":30}{"id":3,"name":"wangwu","age":20}{"id":4,"name":"liuliu","age":40}需求：统计以上文件的平均年龄工具：idea语言：Scala代码：package com.testimport org.apache.spark.SparkConfimport org.apache
复制链接

扫一扫