flink sink HDFS

沧海还一笑

已于 2022-04-19 13:51:20 修改

阅读量723

点赞数

文章标签： flink mysql hadoop hdfs

于 2022-04-13 17:21:07 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_58820420/article/details/124153017

版权

StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();
Properties debeziumProperties = new Properties();
debeziumProperties.put("snapshot.locking.mode", "none");
// 使用flinkCDC从MySQL读取增量数据
DebeziumSourceFunction mySQLSource = MySqlSource.<String>builder()
        .serverTimeZone("UTC")
        .hostname("114.115.150.**")
        .port(3306)
        .databaseList("DBname")
        .startupOptions(StartupOptions.initial())
        .username("user")
        .password("ps")
        .deserializer(new StringDebeziumDeserializationSchema())
        .build();
DataStreamSource dataStreamSource = env.addSource(mySQLSource);
// 写入HDFS
StreamingFileSink<String> sinkBuild = StreamingFileSink
        .forRowFormat(new Path("hdfs://loclhost//user//flink//test1//"), new SimpleStringEncoder<String>("UTF-8"))
        .withRollingPolicy(
                DefaultRollingPolicy.builder()
                        .withRolloverInterval(TimeUnit.MINUTES.toMinutes(5))
                        .withInactivityInterval(TimeUnit.MINUTES.toMinutes(1))
                        .withMaxPartSize(1024 * 1024 * 1024)
                        .build()
        )
        .withBucketAssigner(new MyFlinkSink())
        .build();

dataStreamSource.addSink(sinkBuild).setParallelism(1);

dataStreamSource.print();
env.execute();

沧海还一笑

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
1
评论
flink sink HDFS

此为官方提供的写入HDFS的方式
复制链接

扫一扫

沧海还一笑 CSDN认证博客专家 CSDN认证企业博客

码龄3年

11: 原创

107万+: 周排名

181万+: 总排名

1万+: 访问

: 等级

130: 积分

2: 粉丝

4: 获赞

9: 评论

18: 收藏

私信

关注

热门文章

分类专栏

Scala 1篇

最新评论

flink自定义Sink到HDFS
m0_54822271: 作者你好，请问读hdfs不用设置hadoop的用户吗
Scala单层for循环实现金字塔（三角，妖塔）
悲伤荷包蛋-: 我为什么打印不出来
flink per-job模式启动命令参数详解
沧海还一笑: /flink-1.13.2/bin/flink run -d -t yarn-per-job \ -Dyarn.application.queue=root.dt -Dyarn.application.name=dzh \ -Dtaskmanager.numberOfTaskSlots=2 \ -Djobmanager.memory.process.size=4096mb -Dtaskmanager.memory.process.size=8192mb \ -Denv.java.opts="-Dfile.encoding=UTF-8" \ -c com.lly.kw.flink.cdc.dervied.driver.houre flink/flink-cdc-1.0-SNAPSHOT.jar
flink per-job模式启动命令参数详解
m0_64378799: 在海豚调度器这个命令怎么写?
flink 连接hive（Java版）
南言非度: flink连接hive，hive的远程连接配置是在哪里配的啊

大家在看

postman接口测试工具详解 480

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。