DataX的简单应用

本文介绍了如何使用DataX进行数据同步,包括从本地Linux系统上的CSV文件同步到HDFS,从HDFS同步到Mysql,再将Mysql数据同步到Hbase,最后通过DataX将本地Mysql数据同步到阿里云RDS Mysql。详细阐述了每个步骤的配置文件和注意事项。
摘要由CSDN通过智能技术生成

实验平台及相关准备

操作系统:Linux
JDK版本:1.8
Python版本:2.7
实验前准备了一个csv文件。
其部分内容如下:
该文件一共有11列

实验内容

ps:实验中所有json配置文件均放在job目录下

1.官方实例测试

切换到DataX的bin目录下执行命令:

// 前提是python已经安装成功且配置好了
python datax.py ../job/job.json

结果如下:
在这里插入图片描述
表明实例执行成功!
表明实例执行成功!

2.通过DataX将csv文件从本地linux文件系统同步到HDFS。

对于dataX的相关的json配置文件,如果不清楚其格式,可以执行

python datax.py -r [reader] -w [writer]

就会自动生成配置文件模板。
对于其配置参数,可以到dataX官网.下 相应的reader或writer的doc里查看其详细信息。
txt2hdfs.json配置文件:

{
   
    "job": {
   
        "content": [
            {
   
                "reader": {
   
                    "name": "txtfilereader", 
                    "parameter": {
   
                        "column": [
                            {
   
                                "name": "Element Name",
                                "type": "String",
                                "index": 0
                            },
                            {
   
                                "name": "Windows NT",
                                "type": "String",
                                "index": 1
                            },
                            {
   
                                "name": "Windows",
                                "type": "String",
                                "index": 2
                            },
                            {
   
                                "name": "Windows CE",
                                "type": "String",
                                "index": 3
                            },
                            {
   
                                "name": "Win32s",
                                "type": "String",
                                "index": 4
                            },
                            {
   
                                "name": "Component",
                                "type": "String",
                                "index": 5
                            },
                            {
   
                                "name": "Component Version",
                                "type": "String",
                                "index": 6
                            },
                            {
   
                                "name": "Header File",
                                "type": "String",
                                "index": 7
                            },
                            {
   
                                "name": "Import Library",
                                "type": "String",
                                "index": 8
                            },
                            {
   
                                "name": "Unicode",
                                "type": "String",
                                "index": 9
                            },
                            {
   
                                "name": "Element Type",
                                "type": "String",
                                "index": 10
                            }
                        ], 
                        "encoding": "UTF-8", 
                        "path": ["/home/hadoop/Desktop/WIN32API.CSV"],
                        "csvReaderConfig":
                        {
   
                            "safetySwitch": false,
                            "skipEmptyRecords": false,
                            "useTextQualifier": false
}
                        }
                }, 
                "writer": {
   
                    "name": "hdfswriter", 
                    "parameter": {
   
                        "column": [
                            {
   
                                "name": "Element Name",
                                "type": "String",
                                "index": 0
                            },
                            {
   
                                "name": "Windows NT",
                                "type": "String",
                                <
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值