flink怎么把实时流封装成广播变量并使用

这里有一个例子:

1.flink实现每5分钟读取一次mysql维度表数据,然后把数据封装成广播变量,数据是一个map结构,key车架号,value为车型代码。

2.合并到主流中,主流是一个json,主流获取到广播变量,通过自己的车架号匹配到广播变量的车架号。并获取广播变量的车型代码,封装到主流的json中,最后输出结果

import org.apache.flink.api.common.state.MapStateDescriptor;
import org.apache.flink.streaming.api.datastream.BroadcastStream;
import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment;
import org.apache.flink.util.Collector;

import java.sql.Connection;
import java.sql.DriverManager;
import java.sql.PreparedStatement;
import java.sql.ResultSet;
import java.util.HashMap;
import java.util.Map;

public class MySQLBroadcastAndMergeExample {
    public static void main(String[] args) throws Exception {
        final StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();

        // 定义维度表的描述符
        final MapStateDescriptor<String, String> broadcastStateDescriptor =
                new MapStateDescriptor<>("dimensionData", String.class, String.class);

        // 每5分钟读取一次MySQL中的维度表数据并转换为广播变量
        BroadcastStream<Map<String, String>> broadcastStream = env.addSource(new MySQLSourceFunction())
                .broadcast(broadcastStateDescriptor);

        // 主数据流处理,假设主数据流是一个JSON字符串
        env.socketTextStream("localhost", 9999)
                .map(json -> {
                    // 解析主数据流中的 JSON 字符串,获取车架号
                    // 假设 JSON 中的键为 "vin",表示车架号
                    String vin = extractVINFromJSON(json);
                    return new Tuple2<>(vin, json);
                })
                .connect(broadcastStream)
                .process(new EnrichmentFunction(broadcastStateDescriptor))
                .print();

        env.execute("MySQL Broadcast and Merge Example");
    }

       // 自定义SourceFunction从MySQL中读取数据
    private static class MySQLSourceFunction implements SourceFunction<Map<String, String>> {
        private static final String JDBC_URL = "jdbc:mysql://localhost:3306/database";
        private static final String USER = "username";
        private static final String PASSWORD = "password";
        private static final long INTERVAL = 5 * 60 * 1000; // 5分钟间隔

        private volatile boolean isRunning = true;

        @Override
        public void run(SourceContext<Map<String, String>> ctx) throws Exception {
            Class.forName("com.mysql.cj.jdbc.Driver");

            while (isRunning) {
                Connection connection = DriverManager.getConnection(JDBC_URL, USER, PASSWORD);
                PreparedStatement statement = connection.prepareStatement("SELECT vin, model_code FROM dimension_table");
                ResultSet resultSet = statement.executeQuery();

                Map<String, String> dimensionData = new HashMap<>();
                while (resultSet.next()) {
                    String vin = resultSet.getString("vin");
                    String modelCode = resultSet.getString("model_code");
                    dimensionData.put(vin, modelCode);
                }

                resultSet.close();
                statement.close();
                connection.close();

                ctx.collect(dimensionData);

                // 休眠5分钟
                Thread.sleep(INTERVAL);
            }
        }

        @Override
        public void cancel() {
            isRunning = false;
        }
    }
    // 自定义ProcessFunction用于主数据流的处理
    private static class EnrichmentFunction extends KeyedBroadcastProcessFunction<String, Tuple2<String, String>, Map<String, String>, String> {
        private final MapStateDescriptor<String, String> broadcastStateDescriptor;

        public EnrichmentFunction(MapStateDescriptor<String, String> broadcastStateDescriptor) {
            this.broadcastStateDescriptor = broadcastStateDescriptor;
        }

        @Override
        public void processElement(Tuple2<String, String> value, ReadOnlyContext ctx, Collector<String> out) {
            ReadOnlyBroadcastState<String, String> broadcastState = ctx.getBroadcastState(broadcastStateDescriptor);

            // 从主数据流中获取车架号
            String vin = value.f0;

            // 通过车架号从广播变量中获取车型代码
            String modelCode = broadcastState.get(vin);

            // 将车型代码封装到主数据流的 JSON 中输出
            String enrichedJson = addModelCodeToJSON(value.f1, modelCode);
            out.collect(enrichedJson);
        }

        @Override
        public void processBroadcastElement(Map<String, String> value, Context ctx, Collector<String> out) {
            BroadcastState<String, String> broadcastState = ctx.getBroadcastState(broadcastStateDescriptor);
            broadcastState.clear();

            // 更新广播变量的数据
            for (Map.Entry<String, String> entry : value.entrySet()) {
                broadcastState.put(entry.getKey(), entry.getValue());
            }
        }
    }

    // 解析主数据流中的 JSON 获取车架号
    private static String extractVINFromJSON(String json) {
        // 解析 JSON 获取车架号
        return "VIN123"; // 这里假设直接返回一个固定的车架号
    }

    // 将车型代码封装到主数据流的 JSON 中
    private static String addModelCodeToJSON(String json, String modelCode) {
        // 将车型代码添加到 JSON 中
        return json.replace("\"modelCode\":\"\"", "\"modelCode\":\"" + modelCode + "\"");
    }
}

这个示例展示了如何实现定时读取 MySQL 中的维度表数据并封装成广播变量,然后在 Flink 流处理任务中将主数据流的 JSON 中的车架号与广播变量进行匹配,并将车型代码封装到主数据流的 JSON 中输出。在实际应用中,根据实际的数据格式和业务逻辑进行相应的调整。

  • 9
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值