Flink-CEP之NFA编译器

最新推荐文章于 2023-05-14 13:43:55 发布

vinoYang

最新推荐文章于 2023-05-14 13:43:55 发布

阅读量2.4k

点赞数 2

分类专栏：【Flink】 Apache Flink 文章标签： Flink

本文链接：https://blog.csdn.net/yanghua_kobe/article/details/61430843

版权

【Flink】同时被 2 个专栏收录

68 篇文章 63 订阅

订阅专栏

Apache Flink

66 篇文章 228 订阅

订阅专栏

N F A b

$NFA ^ b$ 编译器的作用是将模式对象编译成NFA或者NFAFactory（用来创建多种NFA对象）。这个编译的过程，需要对模式进行拆分从而构建状态以及根据条件构建状态转换信息，最终根据构建好的状态集合来创建NFA。示意图如下：

编译的核心逻辑见方法compileFactory，它接收一个Pattern对象，在介绍Pattern API时我们已经提及过，Pattern可以通过前置指针形成一个Pattern链，而该方法所接收的对象处于链头（第一个构建的Pattern对象看成是链尾），方法中会对Pattern链进行遍历，具体过程如下：

public static <T> NFAFactory<T> compileFactory(
    Pattern<T, ?> pattern,
    TypeSerializer<T> inputTypeSerializer,
    boolean timeoutHandling) {
    if (pattern == null) {
        //如果模式为null，返回一个NFA工厂的实现，且不传递任何状态，意味着将创建一个空的NFA对象
        return new NFAFactoryImpl<T>(inputTypeSerializer, 0, 
            Collections.<State<T>>emptyList(), timeoutHandling);
    } else {
        //构建一个Map来存储所有生成的状态
        Map<String, State<T>> states = new HashMap<>();
        long windowTime;

        Pattern<T, ?> succeedingPattern;
        State<T> succeedingState;
        Pattern<T, ?> currentPattern = pattern;

        //构建最终态，并加入到Map中，这里将会从Pattern的尾部向头部进行遍历，所以构建的第一个状态是尾部的最终态
        State<T> currentState = new State<>(currentPattern.getName(), State.StateType.Final);
        states.put(currentPattern.getName(), currentState);

        //提取当前Pattern对象的窗口时间
        windowTime = currentPattern.getWindowTime() != null 
            ? currentPattern.getWindowTime().toMilliseconds() 
            : 0L;

        //不断向前遍历（不包含第一个Pattern对象）
        while (currentPattern.getPrevious() != null) {
            //相关变量交换
            succeedingPattern = currentPattern;
            succeedingState = currentState;
            currentPattern = currentPattern.getPrevious();

            //获得窗口时间
            Time currentWindowTime = currentPattern.getWindowTime();

            //如果当前Pattern的窗口时间比其之前Pattern的窗口时间小，则将之前Pattern的窗口时间更新为新的窗口时间
            if (currentWindowTime != null && currentWindowTime.toMilliseconds() < windowTime) {
                windowTime = currentWindowTime.toMilliseconds();
            }

            //获取或构建状态
            if (states.containsKey(currentPattern.getName())) {
                currentState = states.get(currentPattern.getName());
            } else {
                currentState = new State<>(currentPattern.getName(), State.StateType.Normal);
                states.put(currentState.getName(), currentState);
            }

            //为当前状态设置跟后一个状态之间的转换（边），注意状态转换是“TAKE”，这里同时传入了Pattern所注入的条件
            currentState.addStateTransition(new StateTransition<T>(
                StateTransitionAction.TAKE,
                succeedingState,
                (FilterFunction<T>) succeedingPattern.getFilterFunction()));

            //如果后一个模式是非紧邻模式，则为当前状态构建自循环的“IGNORE”转换
            if (succeedingPattern instanceof FollowedByPattern) {
                currentState.addStateTransition(new StateTransition<T>(
                    StateTransitionAction.IGNORE,
                    currentState,
                    null
                ));
            }
        }

        final State<T> beginningState;

        //获取或构建起始状态
        if (states.containsKey(BEGINNING_STATE_NAME)) {
            beginningState = states.get(BEGINNING_STATE_NAME);
        } else {
            beginningState = new State<>(BEGINNING_STATE_NAME, State.StateType.Start);
            states.put(BEGINNING_STATE_NAME, beginningState);
        }

        //添加状态转换（起始状态，只能通过“TAKE”向下一状态转换）
        beginningState.addStateTransition(new StateTransition<T>(
            StateTransitionAction.TAKE,
            currentState,
            (FilterFunction<T>) currentPattern.getFilterFunction()
        ));

        //以所有的状态构建NFAFactoryImpl对象，它将用来创建NFA对象
        return new NFAFactoryImpl<T>(inputTypeSerializer, windowTime, 
            new HashSet<>(states.values()), timeoutHandling);
    }
}