DataWorks 离线同步数据至 Kafka 实操

背景

众所周知,DataWorks 是阿里云开源数据同步工具 DataX 的商业版,其功能、客户支持、可视化操作和插件丰富度等方面均优于开源版本。接下来,我们通过一个实际案例来说明它的应用场景。

公司需要将数据从数据仓库同步到线上数据库,以便部署服务。然而,直接将数据同步到线上数据库存在风险,特别是在数据量很大的情况下,会对数据库造成压力。因此,我们决定将数据写入 Kafka。开发人员可以从 Kafka 中读取数据,这样可以避免直接操作线上数据库。此外,Kafka削峰填谷异步通信高吞吐高可用和高容错等特性,完全满足线上服务的需求。

step1

首先我们需要先创建一个 Topic ,可以在阿里云控制台中可视化操作,具体如下:
在这里插入图片描述
在这里插入图片描述
创建好之后,点击 odps2kafka_test 进入 detail page ,可以看到状态Group消息总量 等状况。

step2

接着在 DataWorks 中创建一个 Di 任务,具体如下:
在这里插入图片描述
任务创建之后同步数据即可,同步完成后可以在 topic 详情页中 消息查询 tag 下查询,结果如下:

在这里插入图片描述

总结

以上就是完整的操作步骤,相信大家感受到实际操作非常简单便捷,阿里云生态建设的很完善,这极大地减轻了开发压力,有任何疑问欢迎大家在评论区留言,也可以扫描下面的二维码关注本人公众号。
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值