datax的使用

datax的使用

提示:主要是测试一下使用方法

一、下载压缩包,解压就能用

地址:
http://datax-opensource.oss-cn-hangzhou.aliyuncs.com/datax.tar.gz
源码地址和官网文档:
https://github.com/alibaba/DataX
需要python2.6.x运行环境,当时我下的3.x然后就报错什么print什么的,查了一下是因为语法不一样,配置python环境很简单,就是安装一下,然后配置个环境变量。

二、使用步骤

1.编辑job文件夹下的json文件,或者自己新建一个sjon

{
    "job": {
        "setting": {
            "speed": {
                 "channel":2
            }
        },
        "content": [
            {
                "reader": {
                    "name": "mysqlreader",
                    "parameter": {
                        "username": "base",
                        "password": "密码",
                        "connection": [
                            {
                                "querySql": [
                                    "select id,login_id,count,level from test111;"
                                ],
                                "jdbcUrl": [
                                    "jdbc:mysql://17x.1x.2x.4x:3306/ywjh_base_kf"
                                ]
                            }
                        ]
                    }
                },
                "writer": {
                    "name": "mysqlwriter", 
                    "parameter": {
                        "column": [
				"id","login_id","count","level"
			], "session": [
                        	"set session sql_mode='ANSI'"
                        ],
                        "connection": [
                            {
                                "jdbcUrl": "jdbc:mysql://127.0.0.1:3306/hh", 
                                "table": ["test111"]
                            }
                        ], 
                        "password": "root", 
                        "username": "root",
			"writeMode": "insert"
                    }

                }
            }
        ]
    }
}

这里我是测试远程的mysql数据同步到本地,官网中什么都有,具体看官网的配置。

2.执行

代码如下(示例):到bin目录下cmd

python datax.py ../job/job.json

如果出现报错是乱码的话,输入CHCP 65001回车,直到打开新窗口出现Active code page: 65001
然后执行,我的第一次错误是我本地数据库没有密码,所以writer里面的密码我没填写,但是这里面要求填写,所以我就给数据库设置了密码,然后就解决了。


总结

datax是个很好用的工具,特别是抽取大量数据非常的好用。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值