Datax同步GP到MongoDB

1.整体流程

读取GP数据-同步到MongoDB。

整体流程用datax完成,使用postgresqlreader和mongodbwriter,(需要符合MongoDB版本),

2.版本问题

202309的dataxmongodbwriter不支持本次用到的mongo6.0.10版本,

mongo-java-driver是3.2.2版本,对应mongo版本可查看,图截不,需要

Compatibility — Java Sync (mongodb.com)

 

 修改兼容的版本,重新编译,上传mongobwriter插件在/datax/plugin/writer

3.配置文件

{
  "job": {
    "setting": {
      "speed": {
        "channel": "3"
      },
	  "priority": 1
    },
    "content": [
      {
		 "reader": {
          "name": "postgresqlreader",
          "parameter": {
            "username": "",
            "password": "",
            "column": [
                "id",
				"province_code",
				"province_name",
				"org_code",
				"org_name",
				"business_type",
				"account_period",
				"risk_type",
				"risk_three_category_code",
				"risk_three_category_name",
				"risk_category_amount_day",
				"risk_category_amount_month",
				"risk_category_amount_year"
            ],
            "connection": [
              {
                "table": [
                  ""
                ],
                "jdbcUrl": [
				"jdbc:postgresql://ip:端口/postgres?characterEncoding=UTF-8&currentSchema=???"
                ]
              }
            ]
          }
        },
		"writer": {
          "name": "mongodbwriter",
          "parameter": {
            "address": [
              ""
            ],
            "userName": "",
            "userPassword": "",
            "dbName": "",
            "collectionName": "",
            "column": [
			{"name": "id", "type": "string"},
			{"name": "province_code", "type": "string"},
			{"name": "province_name", "type": "string"},
			{"name": "org_code", "type": "string"},
			{"name": "org_name", "type": "string"},
			{"name": "business_type", "type": "string"},
			{"name": "account_period", "type": "string"},
			{"name": "risk_type", "type": "string"},
			{"name": "risk_three_category_code", "type": "string"},
			{"name": "risk_three_category_name", "type": "string"},
			{"name": "risk_category_amount_day", "type": "int"},
			{"name": "risk_category_amount_month", "type": "int"},
			{"name": "risk_category_amount_year", "type": "int"}],
			"upsertInfo": {
              "isUpsert": "true",
              "upsertKey": "id"
            }
          }
        }
      }
    ]
  }
}

4.问题注意

4.1字段类型datax会报脏数据的问题

4.2Authentication failed问题

一直认证失败,Mongodb中的每个库都是独立,需要自己创建账号,在需要同步的数据库中建立自己的账号。

> use data
> db.createUser(
    {
      user: "user01",
      pwd: "123456",
      roles: ["readWrite"]
    }
 ) 

4.3 MongoServerError: not primary

本公司mongo服务器有三台,1主2从,原本一直操作的主节点,系统故障后重启主节点换了,需要把访问地址换成主节点的地址就好了

4.4 DS调度器节点安装mongosh命令

下载mongodb-mongosh-1.10.6.x86_64.rpm

rpm -ivh mongodb-mongosh-1.10.6.x86_64.rpm

### 回答1: 我可以提供一种使用Apache DataXMongoDB数据同步到Kudu的方法。步骤如下:1.安装Apache DataXMongoDB Kudu Connector;2.在DataX中配置MongoDB Reader和Kudu Writer;3.运行DataX任务,将MongoDB中的数据同步到Kudu中。 ### 回答2: 编写dataxmongodb到kudu的数据迁移任务需要以下步骤: 1. 安装和配置datax:首先,需要在目标服务器上安装和配置datax,以确保其可以正常运行。可以从datax官方网站下载并安装相应版本的datax。 2. 配置mongodb读取器:在datax的配置文件中,需要指定mongodb作为数据源。可以使用mongodb读取器插件来实现数据的读取。配置文件需要指定mongodb的连接信息(如主机名、端口号、数据库名称和集合名称等)以及读取的字段。 3. 配置kudu写入器:在配置文件中,还需要指定kudu作为数据目标。可以使用kudu写入器插件来实现数据的写入。配置文件需要指定kudu的连接信息(如主机名、端口号和表名等)。 4. 定义字段映射和转换规则:根据需求,需要在配置文件中定义字段映射和转换规则,以使数据能够正确地从mongodb迁移到kudu。例如,可以指定如何映射mongodb中的字段到kudu表中的字段,以及如何进行数据类型转换和格式化等操作。 5. 运行datax任务:配置文件准备好后,可以使用datax命令行工具来运行任务。在命令行中指定配置文件的路径,datax将会读取配置文件并执行数据迁移任务。在执行过程中,可以查看日志来监控任务的运行情况。 总的来说,编写dataxmongodb到kudu的数据迁移任务,需要安装和配置datax,配置mongodb读取器和kudu写入器,定义字段映射和转换规则,最后通过datax命令行工具运行任务。这样就可以实现将mongodb中的数据迁移到kudu中。 ### 回答3: 编写datax将数据从MongoDB导入到Kudu需要以下几个步骤: 1. 确保已经安装好了MongoDB和Kudu,并且能够正常连接到它们。 2. 下载并安装DataXDataX是一个开源的大数据同步工具,可以用于从不同的数据源导入和导出数据。 3. 创建DataX的配置文件,配置文件是一个json格式的文件,用于指定数据源和目标源的相关信息。 4. 在配置文件中,指定MongoDB和Kudu的连接地址、用户名和密码,以及需要导入的MongoDB数据库和集合,以及Kudu的表和列的映射关系。 5. 配置数据转换规则,由于MongoDB和Kudu的数据类型可能不一致,需要使用DataX提供的转换规则来将数据进行格式转换和映射。 6. 运行DataX任务,将数据从MongoDB导入到Kudu。可以通过命令行或者图形界面来启动DataX任务。 7. 监控导入任务,可以通过DataX的日志来查看导入进度和错误情况,以及导入的数据量和时间。 需要注意的是,编写DataX任务需要一定的编程和配置经验,对MongoDB和Kudu的相关知识也有一定的了解。另外,由于DataX是一个通用的数据同步工具,还可以用来从其他数据源导入数据到Kudu,具体配置和步骤可能有所不同。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值