DataX之MySQL数据写入Hive

最新推荐文章于 2025-05-14 19:56:50 发布

docsz

最新推荐文章于 2025-05-14 19:56:50 发布

阅读量2.1k

点赞数

分类专栏： datax

本文链接：https://blog.csdn.net/docsz/article/details/116303979

版权

datax 专栏收录该内容

19 篇文章

订阅专栏

本文介绍了如何编写一个JSON脚本用于将MySQL数据库中的数据迁移到Hive仓库。脚本详细配置了数据读取器（mysqlreader）和数据写入器（hdfswriter），包括连接信息、表名、字段映射和写入模式。执行脚本使用了DataX工具，这是一个高效稳定的数据同步框架。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1、编写脚本mysql-to-hive.json

{
    "job": {
        "setting": {
            "speed": {
                 "channel": 3
            },
            "errorLimit": {
                "record": 0,
                "percentage": 0.02
            }
        },
        "content": [
            {
                "reader": {
                    "name": "mysqlreader",
                    "parameter": {
                        "username": "用户名",
                        "password": "密码",
                        "column": [
				"deptno",
				"dname",
				"loc"
                        ],
                        "connection": [
                            {
                                "table": [
                                    "dept"
                                ],
                                "jdbcUrl": [
					"jdbc:mysql://IP:3306/test"
                                ]
                            }
                        ]
                    }
                },
               "writer": {
                    "name": "hdfswriter",
                    "parameter": {
			"defaultFS": "hdfs://hdfs-ha",
		    "hadoopConfig":{
			"dfs.nameservices": "hdfs-ha",
			"dfs.ha.namenodes.hdfs-ha": "nn1,nn2",
			"dfs.namenode.rpc-address.hdfs-ha.nn1": "node01:8020",
			"dfs.namenode.rpc-address.hdfs-ha.nn2": "node02:8020",
			"dfs.client.failover.proxy.provider.hdfs-ha": "org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider"
			},
                        "fileType": "text",
                        "path": "/user/hive/warehouse/ods.db/datax_dept",
                        "fileName": "202104",
                        "column": [
                            {
                                "name": "deptno",
                                "type": "int"
                            },
                            {
                                "name": "dname",
                                "type": "varchar"
                            },
                            {
                                "name": "loc",
                                "type": "varchar"
                            }
                        ],
                        "writeMode": "append",
                        "fieldDelimiter": "\t"
                    }
                }
            }
        ]
    }
}

2、执行脚本

/datax/bin/datax.py ./mysql-to-hive.json