1.初始化dataset
val dataset = Seq((1,"java"),(2,"python")).toDF("id","text")
2.定义udf函数
val upper: String=>String=_.toUpperCase
3.注册udf函数
import org.apache.spark.sql.functions.udf
val upperUDF = udf(upper)
4.使用udf函数将dataset的text字段转化为大写
dataset.withColumn("text", upperUDF('text)).show