Flink 读取 Minio 写入 Doris 踩坑记录

2023/12/15 菜鸟记录.

场景:Minio上存储了txt文件,需要Flink读取解析,写入Doris表。

背景:Flink版本 1.14.4

           Doris版本 1.1.5

采坑1:使用自定义SourceFunction读取Minio数据,使用Flink-Doris-Connector写入Doris。

结果1:写入失败,不报错。因为无界流写入Doris必须开启Batch模式。

        但是坑来了,SourceFunction的有界性是写死的,值为无界。所以设置批处理模式后会运行报错:Detected an UNBOUNDED source with the 'execution.runtime-mode' set to 'BATCH.

采坑2:使用自定义SourceFunction读取Minio数据,使用Flink-Mysql-Connector写入Doris。

结果2:写入成功,但是速度太慢。3并行度每秒才写入几十条,设置了批写入提升效果不明显。

采坑3:使用Doris自带的Broker Load导入。

结果3:BrokerLoad功能有限,只能将映射文件中的字段c1到表中的clear_pass,但是不能指定dict_id为定值‘111’.

最终实现:使用Flink-S3-Connector读取Minio数据,使用Flink-Doris-Connector写入Doris。

把Flink官网仔细通读了一遍,发现Flink兼容Minio这样的S3对象存储服务。详见:Amazon S3 | Apache Flink

步骤 1:在flink-conf.yaml配置中添加:(切记s3.endpoint要加http://, 踩过坑。)

s3.access-key: XXXXXXX
s3.secret-key: XXXXXXX
s3.endpoint: http://XXXXXXXXX:XXXX/
s3.path.style.access: true
fs.allowed-fallback-filesystems: s3

步骤 2:下载S3插件,flink-s3-fs-hadoop-(flink版本号).jar

https://mvnrepository.com/artifact/org.apache.flink/flink-s3-fs-hadoop

步骤 3:在服务器的 (Flink目录)/plugins/目录下创建目录flink-s3-fs-hadoop,把jar包放进来。不用在pom里引依赖,Flink会默认在plugins/下面找。

步骤 4:重启Flink服务。配置生效,flink-s3-fs-hadoop插件自动载入。

步骤 5:Coding!直接用!

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Flink可以通过MinIO的API来读取MinIO中的文件。首先,你需要使用Minio的Java SDK来初始化一个MinioClient对象,该对象用于与MinIO服务器进行交互。代码示例中的`InitMinio()`方法就是一个初始化MinioClient对象的示例。在此方法中,你需要提供MinIO服务器的访问地址、账号和密码等信息。然后,你可以使用MinioClient对象的方法来读取MinIO中的文件,例如使用`getObject()`方法来获取特定文件的输入流。最后,你可以将输入流传递给Flink的数据源来读取文件的内容。在Flink中,你可以使用`readTextFile()`方法来从输入流中读取文件内容。这样,你就可以在Flink读取MinIO中的文件了。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* [【运维/安装】Flink + MinIO:实现light-weighting思路下的集群(集群、高可用&&POC、快速搭建)](https://blog.csdn.net/hiliang521/article/details/126860098)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"] - *3* [SpringBoot整合Minio文件存储](https://blog.csdn.net/wadfdhsajd/article/details/125540919)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值