文章目录
Streaming Deduplication
介绍
在实时流式应用中,最典型的应用场景:网站UV统计。
1:实时统计网站UV,比如每日网站UV;
2:统计最近一段时间(比如一个小时)网站UV,可以设置水位Watermark;
Structured Streaming可以使用deduplication对有无Watermark的流式数据进行去重操作:
1.无
文章目录
在实时流式应用中,最典型的应用场景:网站UV统计。
1:实时统计网站UV,比如每日网站UV;
2:统计最近一段时间(比如一个小时)网站UV,可以设置水位Watermark;
Structured Streaming可以使用deduplication对有无Watermark的流式数据进行去重操作:
1.无