Flink多并行度水印测试

最新推荐文章于 2022-03-16 20:25:56 发布

Marsotian

最新推荐文章于 2022-03-16 20:25:56 发布

阅读量1.1k

点赞数 1

分类专栏： flink 文章标签： flinkcep flink

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Marsotian/article/details/107360613

版权

Flink多并行度水印测试

数据来源为kafka，一共4个分区，此时为了直观分析，将flink的并发度设置为3；依次发送数据，分析多并行度情况下flink的水印情况；

设置flink并发度为3，flink窗口大小为3秒，水印延迟为100秒

先上代码：

 		//获取运行环境
        StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();

        //设置使用eventtime，默认是使用processtime
        env.setStreamTimeCharacteristic(TimeCharacteristic.EventTime);


        //设置并行度为3,默认并行度是当前机器的cpu数量
        env.setParallelism(3);

        String topic = "test01";
        Properties prop = new Properties();
        prop.setProperty("bootstrap.servers","vm01:9092");
        prop.setProperty("group.id","con1");

        FlinkKafkaConsumer010<String> myConsumer = new FlinkKafkaConsumer010<>(topic, new SimpleStringSchema(), prop);

        myConsumer.setStartFromGroupOffsets();//默认消费策略

        DataStreamSource<String> text &#

最低0.47元/天解锁文章

关注

1
点赞
踩
6

收藏

觉得还不错? 一键收藏
5
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Marsotian CSDN认证博客专家 CSDN认证企业博客

码龄13年

1: 原创

71万+: 周排名

72万+: 总排名

1124: 访问

: 等级

28: 积分

0: 粉丝

1: 获赞

5: 评论

6: 收藏

私信

关注

热门文章

Flink多并行度水印测试 1124

分类专栏

flink

最新评论

Flink多并行度水印测试
X_2018: 可以使用 WatermarkStrategy 来检测空闲输入并将其标记为空闲状态。
Flink多并行度水印测试
Jeckian: kafka为分区为4，只写入一个分区，因为触发不了水印更新，所以窗口也不会计算==》这种情况有什么解决方法吗？kafka一个分区，但是我想多个并行度，在addsource后，rebalance可以吗？或者有其他的方法吗？
Flink多并行度水印测试
Hellooorld: 博主你好当第八条数据达到，此时才会第一次触发001,2020/7/14 00:00:00数据的窗口计算第一次出发的时候002,2020/7/14 00:00:30这个数据也会出发把？
Flink多并行度水印测试
敲代码的乔帮主: 理解满分
Flink多并行度水印测试
胖胖胖胖胖虎: 感谢博主，kafka为分区为4，只写入一个分区，因为触发不了水印更新，所以窗口也不会计算，这样理解对吗？谢谢、

最新文章

目录

评论 5

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。