流式计算关于数据时间的3个重要概念

从数据的产生到数据被处理有三个重要的时间节点,搞清楚这三个时间节点,形成关于它们的概念,了解它们之间的关系,对帮助开发者编写正确的数据处理逻辑程序至关重要。

Event Time

事件时间,也就是数据发生的时间,比如电表在某个时间点上的读数,交通工具在某个时点上的位置和速度等。事件时间由传感器提供,它早于处理数据的程序拿到它的时间。在做差值计算时,开发者应该使用事件时间,而不是数据处理程序拿到数据的时间,才能获得正确的差值计算结果。

Ingestion Time

采集时间,指的是数据被传入消息队列等数据采集工具的时间。它晚于事件时间。由于事件时间一般来自于传感器等第三方系统,而第三方系统可能不被信任,开发者可以使用采集时间代替事件时间,当然前提是采集时间和事件时间之差在可接受的范围内。

Processing Time

处理时间,指的是数据被处理时的时间。它晚于采集时间,有时候可能会大大地晚于事件时间和采集时间。这是数据处理程序在处理数据时记录的时间。开发者如果使用这个时间来做差值计算就会得到异常的结果。

三个时间概念的关系

三个时间概念中事件时间最早,其次是采集时间,再次是处理时间。数据处理程序应该记录事件时间,这是数据处理的集成,其次是处理时间以便于审核数据处理过程。采集时间可以用来考察数据采集程序的效率。处理时间和采集时间的差值可以看出流式处理程序的是否实时。

举例

以下是通过某电表能耗的差值计算过程,展示了三个时间概念的关系。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

surfirst

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值