目录
本文包含 Python 用户定义函数 (UDF) 示例。 它展示了如何注册 UDF、如何调用 UDF 以及有关 Spark SQL 中子表达式的计算顺序的注意事项。
注册一个UDF
def squared(s):
return s * s
spark.udf.register("squaredWithPython", squared)
你也可以指定返回类型
默认是StringType。
from pyspark.sql.types import LongType
def squared_typed(s):
return s * s
spark.udf.register("squaredWithPython", squared_typed, LongType())
PySpark SQL Types类型
StringType | ShortType |
ArrayType</ |