sparkSQL自定义函数
sparkSQL自定义函数
关键函数
sparkSession.udf.register
有两种风格:
- 面向对象式风格,通过实现匿名内部类来实现自定义功能
- 面向函数式风格(一般选这种,比较简洁,见代码)
- register:第一个参数为函数名,第二个参数为一个函数,最后一个参数是register的返回值类型
- 第二个参数函数的前N个参数为该函数的返回值,最后一个参数为该函数的返回值
代码
import org.apache.spark.SparkConf
import org.apache.spark.sql.api.java.UDF1
import org.apache.spark.sql.types.StringType
import org.apache.spark