大数据开发-Flink-CEP的主要原理和使用

最新推荐文章于 2024-08-02 21:09:07 发布

Hoult-吴邪

最新推荐文章于 2024-08-02 21:09:07 发布

阅读量592

点赞数

本文链接：https://blog.csdn.net/hu_lichao/article/details/116906069

版权

本文介绍了Flink的复杂事件处理（CEP）技术，包括CEP的基础概念、特征、功能以及Flink CEP库的主要组件。讨论了模式API如个体模式、模式序列及其条件，并详细阐述了Flink CEP的开发流程和主要工作原理，指出其将用户逻辑转化为有限状态机进行事件检测。

摘要由CSDN通过智能技术生成

总结就是：输入-规则-输出

就是单事件的自关联，其实匹配的也是时间序列的

定义基础

（1）定义复合事件处理（Complex Event Processing，CEP）是一种基于动态环境中事件流的分析技术，事件在这里通常是有意义的状态变化，通过分析事件间的关系，利用过滤、关联、聚合等技术，根据事件间的时序关系和聚合关系制定检测规则，持续地从事件流中查询出符合要求的事件序列，最终分析得到更复杂的复合事件

（2）特征 CEP的特征如下：目标：从有序的简单事件流中发现一些高阶特征；输入：一个或多个简单事件构成的事件流；处理：识别简单事件之间的内在联系，多个符合一定规则的简单事件构成复杂事件；输出：满足规则的复杂事件

（3）功能

CEP用于分析低延迟、频繁产生的不同来源的事件流。CEP可以帮助在复杂的、不相关的时间流中找出有意义的模式和复杂的关系，以接近实时或准实时的获得通知或组织一些行为。 CEP支持在流上进行模式匹配，根据模式的条件不同，分为连续的条件或不连续的条件；模式的条件允许有时间的限制，当条件范围内没有达到满足的条件时，会导致模式匹配超时。看起来很简单，但是它有很多不同的功能： ① 输入的流数据，尽快产生结果； ② 在2个事件流上，基于时间进行聚合类的计算； ③ 提供实时/准实时的警告和通知； ④ 在多样的数据源中产生关联分析模式； ⑤ 高吞吐、低延迟的处理市场上有多种CEP的解决方案，例如Spark、Samza、Beam等，但他们都没有提供专门的库支持。然而，Flink提供了专门的CEP库。

（4）主要组件 Flink为CEP提供了专门的Flink CEP library

它包含如下组件：Event Stream、Pattern定义、Pattern检测和生成Alert。首先，开发人员要在DataStream流上定义出模式条件，之后Flink CEP引擎进行模式检测，必要时生成警告。

CEP里面的模式API

（1）个体模式（Individual Patterns）组成复杂规则的每一个单

独的模式定义，就是个体模式。

start.times(3).where(_.behavior.startsWith(‘fav’))<

最低0.47元/天解锁文章

Hoult-吴邪

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫