大数据笔记之Datax配置Oracle任务将数据写入HDFS(HA)


前言

datax笔记


一、json配置

{
    "job": {
        "content": [
            {
                "reader": {
                    "name": "oraclereader",
                    "parameter": {
                        "connection": [
                            {
                                "jdbcUrl": [
                                    "jdbc:oracle:thin:@127.0.0.1:1521:test"
                                ],
                                "querySql": [
                                    "select name,card_id from student"
                                ]
                            }
                        ],
                        "password": "123456",
                        "username": "testapp"
                    }
                },
                "writer": {
                    "name": "hdfswriter",
                    "parameter": {
                        "column": [
                            {
                                "name": "name",
                                "type": "string"
                            },
                            {
                                "name": "card_id",
                                "type": "string"
                            }
                        ],
                        // TODO core-site.xml里查看
                        "defaultFS": "hdfs://mytest",
                        "fieldDelimiter": "	",
                        "fileName": "文件名.txt",
                        "fileType": "text",
                        "hadoopConfig": {
                            "dfs.client.failover.proxy.provider.mytest": "org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider",
                            // TODO 查看hdfs-site.xml
                            "dfs.ha.namenodes.mytest": "nn1,nn2",
                            "dfs.namenode.rpc-address.mytest.nn1": "192.168.1.100:9000",
                            "dfs.namenode.rpc-address.mytest.nn2": "192.168.1.101:9000",
                            "dfs.nameservices": "mytest"
                        },
                        "path": "/",
                        "writeMode": "append"
                    }
                }
            }
        ],
        "setting": {
            "errorLimit": {
                "percentage": 0.02,
                "record": 0
            },
            "speed": {
                "channel": 1
            }
        }
    }
}

二、使用步骤

1.上传文件

将上述json修改成自己的信息后,保存到成json文件,上传到datax的job目录下。

2.执行任务

执行如下命令执行任务

python bin/datax.py job/oraclereader.json

三、参数化

将job中的属性值参数化,如将密码的属性执行改为 $password
在执行脚本中传递,方式如下

python bin/datax.py -p "-Dpassword=123456" job/oraclereader.json

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值