Flink DataStream iterate算子的简单使用

Flink DataStream iterate算子的简单使用

由于DataStream程序可能永远不会完成,因此没有最大迭代次数。相反你需要指定流的哪个部分反馈到迭代,哪个部分使用split转换或转发到下游filter。

下面看示例:


public class IterateOperator {
    public static void main(String[] args) throws Exception {

        StreamExecutionEnvironment sEnv = StreamExecutionEnvironment.getExecutionEnvironment();
        sEnv.setParallelism(1);

        Properties p = new Properties();
        p.setProperty("bootstrap.servers", "localhost:9092");

        DataStreamSource<String> source = sEnv.addSource(new FlinkKafkaConsumer010<String>("people", new SimpleStringSchema(), p));

        IterativeStream<People> iterate = source.map(new MapFunction<String, People>() {
            @Override
            public People map(String value) throws Exception {
                return new Gson().fromJson(value, People.class);
            }
        }).iterate();


        SingleOutputStreamOperator<People> feedback = iterate.filter(new FilterFunction<People>() {
            @Override
            public boolean filter(People value) throws Exception {
                return "caocao".equals(value.name());
            }
        });

        // 如果有符合feedback过滤条件的数据,比如:name为caocao的,会持续不断的循环输出
        feedback.print("feedback:");

        iterate.closeWith(feedback);

        SingleOutputStreamOperator<People> result = iterate.filter(new FilterFunction<People>() {
            @Override
            public boolean filter(People value) throws Exception {
                return !"caocao".equals(value.name());
            }
        });

        result.print("result:");


        // split
        SplitStream<People> split = iterate.split(new OutputSelector<People>() {
            @Override
            public Iterable<String> select(People value) {
                ArrayList<String> list = new ArrayList<>();
                if ("male".equals(value.sex())) {
                    list.add("male");
                } else {
                    list.add("female");
                }
                return list;
            }
        });

        DataStream<People> male = split.select("male");
        male.print("male:");

        iterate.closeWith(male);

        sEnv.execute("IterateOperator");
    }
}

在kafka product端,输入{“name”:“caocao”,“age”:18,“sex”:“male”},会发现"feedback:"的流和"male:"在持续不断的迭代输出。

  • 3
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值