datax的使用以及参数解释，快速入门版

最新推荐文章于 2025-03-17 21:51:46 发布

析杴

最新推荐文章于 2025-03-17 21:51:46 发布

阅读量6.3k

点赞数 17

分类专栏： spark 文章标签： hadoop hdfs java

本文链接：https://blog.csdn.net/weixin_67485772/article/details/131196889

版权

spark 专栏收录该内容

2 篇文章

订阅专栏

DataX是一个数据同步工具，用于在不同系统间迁移数据，如从HDFS到MySQL。配置文件是JSON格式，包括reader和writer参数，分别定义数据源和目标。reader参数如path指定HDFS文件位置，writer参数如writeMode设定MySQL的写入方式。此文章适合初学者快速了解DataX基础用法。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

datax的使用以及参数解释

前言

本文我们介绍一下datax的基础用法，让初学者能够实现快速入门，即刻应用

一、datax是什么？

首先，来了解一下datax是什么，datax简单可以理解为数据同步的一个工具，将一个系统中存储的数据存储到另一个系统中。
举例来说，我们将数据存储到了HDFS中，但是现在我们想要使用这些数据来进行可视化分析，那么我们就要用到datax，将HDFS中的数据同步到MYSQL中，便于可视化的使用。

二、文件配置说明

文件安装我们就不多赘述了，直接开始讲解datax如何使用。

1.查看配置文件

{
    "job": {
        "setting": {
            "speed": {
                "channel": 3
            }
        },
        "content": [
            {
                "reader": {
                    "name": "hdfsreader",
                    "parameter": {
                        "path": "/user/spark_design/output/user_anaylse/",
                        "defaultFS": "hdfs://master:9000",
                        "column": [
                               {
                                "index": 0,
                                "type": "string"
                               },
                               {
                                "index": 1,
                                "type": "long"
                               }
                            
                        ],
                        "fileType": "text",
                        "encoding": "UTF-8",
                        "fieldDelimiter": ","
                    }

                },
                "writer": {
                    "name": "mysqlwriter",
                    "parameter": {
                        "writeMode": "insert",
                        "username": "root",
                        "password": "123456",
                        "column": [
                            "province",
                            "number"
                        ],
                        "preSql": [
                            "delete from user_anaylse"
                        ],
                        "connection": [
                            {
                                "jdbcUrl": "jdbc:mysql://127.0.0.1:3306/spark_design?useUnicode=true&characterEncoding=UTF-8",
                                "table": [
                                    "user_anaylse"
                                ]
                            }
                        ]
                    }
                }


            }
        ]
    }
}