三十二：Flink计算PV,UV代码实现

for your wish

已于 2022-04-20 08:53:36 修改

阅读量560

点赞数

文章标签： flink uv kafka

于 2022-02-26 11:40:56 首次发布

本文链接：https://blog.csdn.net/someInNeed/article/details/123147483

版权

Flink 专栏收录该内容

41 篇文章 6 订阅 ¥29.90 ¥99.00

订阅专栏

超级会员免费看

我们学习了 Flink 消费 Kafka 数据计算 PV 和 UV 的水印和窗口设计，并且定义了窗口计算的触发器，完成了计算 PV 和 UV 前的所有准备工作。

接下来就需要计算 PV 和 UV 了。在当前业务场景下，根据 userId 进行统计，PV 需要对 userId 进行统计，而 UV 则需要对 userId 进行去重统计。

下面我们使用不同的方法来统计 PV 和 UV。

单窗口内存统计

这种方法需要把一天内所有的数据进行缓存，然后在内存中遍历接收的数据，进行 PV 和 UV 的叠加统计。

StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment(); 
env.setStreamTimeCharacteristic(TimeCharacteristic.EventTime); 
env.setStateBackend(new MemoryStateBackend(true)); 
Properties properties = new Properties(); 
properties.setProperty("bootstrap.servers", "127.0.0.1:9092"); 
properties.setProperty(FlinkKafkaConsumerBase.KEY_PARTITION_DISCOVERY_INTERVAL_MILLIS, "10"); 
FlinkKafkaConsumer<String> consumer = new FlinkKafkaConsumer<>("log_user_action", new SimpleStringSchema(), properties); 
//设置从最早的offset消费 
consumer.

了解本专栏

超级会员免费看

for your wish

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
三十二：Flink计算PV,UV代码实现

我们学习了 Flink 消费 Kafka 数据计算 PV 和 UV 的水印和窗口设计，并且定义了窗口计算的触发器，完成了计算 PV 和 UV 前的所有准备工作。接下来就需要计算 PV 和 UV 了。在当前业务场景下，根据 userId 进行统计，PV 需要对 userId 进行统计，而 UV 则需要对 userId 进行去重统计。下面我们使用不同的方法来统计 PV 和 UV。单窗口内存统计这种方法需要把一天内所有的数据进行缓存，然后在内存中遍历接收的数据，进行 PV...
复制链接

扫一扫