解决 datax 批量同步表功能(灵活控制表的个数)实现

44 篇文章 183 订阅 ¥9.90 ¥99.00
12 篇文章 1 订阅
本文介绍了如何使用DataX实现在数据库间批量同步表的功能。通过创建目录、存储表名列表、配置DataX JSON脚本及编写shell脚本,实现了从一个数据库模式到另一个模式的批量数据迁移。如果需要每日增量同步,文中提到后续会发布相关配置文章。
摘要由CSDN通过智能技术生成

1 datax 只能实现一个一个的表进行同步功能,如果想实现将某一个库下所有的表,或者部分表进行同步,需要怎么做呢?

datax的同步配置信息:

{
    "job": {

        "content": [
            {
                "reader": {
                    "name": "mysqlreader", #指定使用mysqlreader读取数据。
                    "parameter": {
                        "username": "username",#MySQL用户名。
                        "password": "password",#MySQL密码。
                        "connection": [
                            {
                                "querySql": [ #指定执行的SQL语句。
                                    "select bucket_name, delta , timestamp ,cdn_in, cdn_out ,total_request from vip_quota where bucket_name='xxx' "
                                ],
                                "jdbcUrl": ["jdbc:mysql://192.168.0.8:3306/db1?useUnicode=true&characterEncoding=UTF-8&autoReconnect=true" #jd
  • 3
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 2
    评论
以下是一个简单的示例,演示如何使用DataX实现数据同步到一个JSON文件中。 假设我们有两个,一个是用户信息(user),一个是订单信息(order),它们的结构如下: user: | id | name | age | | ---- | ---- | ---- | | 1 | Tom | 20 | | 2 | Jack | 22 | | 3 | Mary | 21 | order: | id | user_id | product | amount | | ---- | ------- | ------- | ------ | | 1 | 1 | iPhone | 1 | | 2 | 1 | iPad | 2 | | 3 | 2 | MacBook | 1 | 我们需要将这两个的数据同步到一个JSON文件中,格式如下: ``` { "users": [ { "id": 1, "name": "Tom", "age": 20, "orders": [ { "id": 1, "product": "iPhone", "amount": 1 }, { "id": 2, "product": "iPad", "amount": 2 } ] }, { "id": 2, "name": "Jack", "age": 22, "orders": [ { "id": 3, "product": "MacBook", "amount": 1 } ] }, { "id": 3, "name": "Mary", "age": 21, "orders": [] } ] } ``` 其中,每个用户包含其基本信息和订单信息,如果用户没有订单,则其订单列为空。 为了实现这个需求,我们可以使用DataX中的两个插件:MySQL Reader插件和JSON Writer插件。 首先,我们需要在DataX的配置文件中配置MySQL Reader插件,使用SQL语句从数据库中读取数据。配置文件示例如下: ``` { "job": { "content": [ { "reader": { "name": "mysqlreader", "parameter": { "connection": [ { "jdbcUrl": "jdbc:mysql://127.0.0.1:3306/test", "table": [ "user", "order" ], "username": "root", "password": "root" } ], "column": [ "user.id", "user.name", "user.age", "order.id", "order.product", "order.amount" ], "where": "", "splitPk": "", "encoding": "UTF-8" } }, "writer": null } ], "setting": { "speed": { "channel": 1 } } } } ``` 在该配置文件中,我们使用了MySQL Reader插件,从MySQL数据库中读取了user和order的数据。为了方便后续处理,我们将两个的数据列合并到了一起。 接下来,我们需要在配置文件中配置JSON Writer插件,将数据写入到JSON文件中。配置文件示例如下: ``` { "job": { "content": [ { "reader": { "name": "mysqlreader", "parameter": { "connection": [ { "jdbcUrl": "jdbc:mysql://127.0.0.1:3306/test", "table": [ "user", "order" ], "username": "root", "password": "root" } ], "column": [ "user.id", "user.name", "user.age", "order.id", "order.product", "order.amount" ], "where": "", "splitPk": "", "encoding": "UTF-8" } }, "writer": { "name": "jsonwriter", "parameter": { "path": "/data/users.json", "fileType": "NORMAL", "compress": "NONE", "encoding": "UTF-8", "dateFormat": "yyyy-MM-dd HH:mm:ss", "writeMode": "APPEND", "column": [ { "name": "id", "type": "LONG" }, { "name": "name", "type": "STRING" }, { "name": "age", "type": "LONG" }, { "name": "orders", "type": "ARRAY", "childColumn": [ { "name": "id", "type": "LONG" }, { "name": "product", "type": "STRING" }, { "name": "amount", "type": "LONG" } ] } ] } } } ], "setting": { "speed": { "channel": 1 } } } } ``` 在该配置文件中,我们使用了JSON Writer插件,将数据写入到了一个JSON文件中。我们将用户信息的id、name和age作为一级字段,将订单信息的id、product和amount作为二级字段,使用数组形式存储在orders字段中。 最后,我们使用DataX启动任务,即可将数据从MySQL数据库中读取,并写入到一个JSON文件中。 以上示例仅供参考,实际使用中需要根据具体需求进行调整。
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

lg4546

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值