1.概述
一些算子和函数能够进行一些时间上的操作,但是不能获取算子当前的Processing Time或者是Watermark时间戳,调用起来简单但功能相对受限。如果想获取数据流中Watermark的时间戳,或者在时间上前后穿梭,需要使用ProcessFunction
系列函数,它们是Flink体系中最底层的API,提供了对数据流更细粒度的操作权限。Flink SQL是基于这些函数实现的,一些需要高度个性化的业务场景也需要使用这些函数。
- 不要跟ProcessWindowFunction混为一谈
- ProcessFunction是 一个低阶的流处理操作,它可以访问流处理程序的基础构建模块:
➢ 事件(event)(流元素)
➢ 状态(state)(容错性,一致性, 仅在keyed stream中)
➢ 定时器(timers)(event time和processing time,仅在keyed stream中) - ProcessFunction可以看作是一个具有keyed state和timers访问权的FlatMapFunction
➢ 通过RuntimeContext访 问keyed state
➢ 计时器允许应用程序对处理时间和事件时间中的更改作出响应。对processEleme(…)函数的每次
调用都获得- -个Context对象,该对象可以访问元素的event time timestamp和TimerService
➢ TimerService 可用于为将来的event/process time瞬间注册回调。当到达计时器的特定时间时,将</