flink学习（一）——什么是流处理

最新推荐文章于 2024-07-17 06:01:06 发布

Yohohaha

最新推荐文章于 2024-07-17 06:01:06 发布

阅读量584

点赞数 2

分类专栏： flink 文章标签： flink

本文链接：https://blog.csdn.net/Yohohaha/article/details/110510604

版权

flink 专栏收录该内容

9 篇文章 5 订阅

订阅专栏

流处理引入

为了理解流处理，我们先来看看批处理。批处理是把我们感兴趣的数据一起搜集下来加以处理，产生结果。比如说双十一当天有多少个用户购买了商品，每个用户分别买了多少件，分别是哪些品类的商品。过去需要第二天或者几个小时后才能出统计结果，我们才能知道双十一当天或者截止到某个小时有多少人买了东西等，这些是批处理的结果。批处理的结果生成相距用户实际行为的发生间隔了很长一段时间，往往是一天或者几小时。在现在的互联网竞争下，有时候这些数据统计延迟是无法接受的，我们需要更快地知道当前最新的数据状态，这就需要流处理（也可以说是实时计算，实时处理）。

回过头来想，流处理是数据处理的正常模式。因为本身数据是随时随地在生成的，那么数据生成后就得到结果是一个比较自然的状态。比如网页点击pv、uv，金融交易，传感器数据等都是常见的流数据。数据是流式，那么我们的处理方式也应该是流式的。