Datax使用rdbmsreader支持clickhouse的读取

参考链接:(22条消息) 使用datax的rdbmsreader实现读取clickhouse_Sleten09的博客-CSDN博客

背景:想要把click house的数据源同步到HDFS,发现Datax没有clickhousereader组件。

1、把clickhousewriter/libs下的所有jar包复制到rdbmsreader/libs下,同名jar包直接替换,另外,删掉rm -f guava-r05.jar这个包,否则会报错

cp 自己的Datax安装目录/datax/plugin/writer/clickhousewriter/libs/* 自己的Datax安装目录/datax/plugin/reader/rdbmsreader/libs/

复制完, rdbmsreader/libs下的包如下:

 2、修改plugin.json文件:在"driver" 增加 "ru.yandex.clickhouse.ClickHouseDriver"

[root@*** plugin]# cat reader/rdbmsreader/plugin.json 
{
    "name": "rdbmsreader",
    "class": "com.alibaba.datax.plugin.reader.rdbmsreader.RdbmsReader",
    "description": "useScene: prod. mechanism: Jdbc connection using the database, execute select sql, retrieve data from the ResultSet. warn: The more you know about the database, the less problems you encounter.",
    "developer": "alibaba",
    "drivers":["dm.jdbc.driver.DmDriver", "com.sybase.jdbc3.jdbc.SybDriver", "com.edb.Driver", "ru.yandex.clickhouse.ClickHouseDriver"]
}

3、编辑json文件

{
  "job": {
    "content": [
      {
        "reader": {
          "parameter": {
            "password": "password",
            "column": [
              "id",
              "state",
              "time"
            ],
            "connection": [
              {
                "jdbcUrl": [
                  "jdbc:clickhouse://ip:port/default"
                ],
                "table": [
                  "table_name"
                ]
              }
            ],
            "username": "username"
          },
          "name": "rdbmsreader"
        },
          "writer": {
               "name": "streamwriter",
               "parameter": {
                    "print":true
                }
           }
        }
    ],
    "setting": {
      "errorLimit": {
        "record": 0,
        "percentage": 0.02
      },
      "speed": {
        "channel": 3
      }
    }
  }
}
  • 3
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
支持clickhouse导出的datax是一种数据导出工具,能够将clickhouse数据库中的数据快速导出到其他目标数据源中。它具有以下几个优点。 首先,datax支持多种数据源的导出,包括关系型数据库、NoSQL数据库、大数据存储系统等,因此可以满足不同数据源之间的数据迁移和同步需求。这使得使用clickhouse数据库的用户可以方便地将数据导出到其他系统中进行分析和处理。 其次,datax具有高效的导出性能。它采用分布式的方式进行数据导出,可以同时利用多台机器的计算和存储资源,提高导出速度。对于大规模数据导出的需求,datax能够快速而稳定地完成任务。 另外,datax支持参数配置和插件扩展,具有很高的灵活性。用户可以根据自己的需求来配置导出任务的各种参数,如数据过滤条件、并发度、目标表映射关系等。同时,datax提供了丰富的插件扩展机制,用户可以根据实际需求编写自定义插件,以满足特定的数据导出要求。 最后,datax具有良好的兼容性和稳定性。它可以与clickhouse数据库完美集成,充分利用clickhouse的功能和性能优势,保证数据导出的准确性和稳定性。同时,datax经过了广泛的实际应用测试,已经被许多企业和开发者所采用和验证,具有较高的可靠性和可用性。 总之,支持clickhouse导出的datax是一款功能强大、性能优异、灵活可扩展的数据导出工具,它可以帮助用户高效地将clickhouse数据库中的数据导出到其他目标数据源中,满足不同的数据处理和分析需求。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值