十九、Flink自定义单并行Source

猫猫爱吃小鱼粮

于 2023-08-13 19:35:00 发布

阅读量526

点赞数 2

分类专栏： Flink精通~DataStreamAPI使用文章标签： flink apache java

本文链接：https://blog.csdn.net/m0_50186249/article/details/122139990

版权

Flink精通~DataStreamAPI使用专栏收录该内容

32 篇文章 5 订阅

订阅专栏

1、概述

1）作用

自定义并行度为1的Source。

2）流程

1.实现SourceFunction接口，并重写run()方法

2、代码实现

import org.apache.flink.configuration.Configuration;
import org.apache.flink.streaming.api.datastream.DataStreamSource;
import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment;
import org.apache.flink.streaming.api.functions.source.SourceFunction;

/**
 * 自定义非并行的Source，即Source的并行度只为1
 * <p>
 * 如果实现了SourceFunction接口或继承了RichSourceFunction抽象类，得到的DataStream为只有一个并行
 */
public class CustomerNonParallelSource {
    public static void main(String[] args) throws Exception {
        StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();

        DataStreamSource<Integer> nums = env.addSource(new NonParallelSourceFunc());

        System.out.println("自定义NonParallelSourceFunc得到的DataStream的并行度为：" + nums.getParallelism());
        nums.print();

        env.execute();
    }

    private static class NonParallelSourceFunc implements SourceFunction<Integer> {

        /**
         * run方法task启动后会执行一次
         * 如果run方法一直不退出，就是一个无限的数据流
         * 如果数据读取完了，run方法退出，就是一个有限的数据流，Source退出，job也停止了
         *
         * @param ctx
         * @throws Exception
         */
        @Override
        public void run(SourceContext<Integer> ctx) throws Exception {
            System.out.println("Run方法被调用了");
            
            for (int i = 0; i < 100; i++) {
                //Source产生的数据使用SourceContext将数据输出
                ctx.collect(i);
            }
        }

        /**
         * task cancel会执行一次
         */
        @Override
        public void cancel() {
            System.out.println("Cancel方法被调用了~~~~~");
        }
    }
}