大数据Flink(一百):SQL自定义函数(UDF)和标量函数(Scalar Function)
Python UDF,即 Python ScalarFunction,针对每一条输入数据,仅产生一条输出数据。目前 Flink 自定义函数可以基于 JVM 语言(例如 Java 或 Scala)或 Python 实现,实现者可以在 UDF 中使用任意第三方库,本章聚焦于使用 Python 语言开发自定义函数。自定义函数(UDF)是一种扩展开发机制,可以用来在查询语句里调用难以用 SQL 进行 直接 表达的频繁使用或自定义的逻辑。Flink 体系也提供了类似于其他大数据引擎的 UDF 体系。
复制链接