Chunjun数据同步工具初体验

只爱大锅饭

已于 2023-10-12 11:12:58 修改

阅读量1.5k

点赞数

分类专栏：大数据学习之路文章标签： flink 大数据 big data

于 2023-05-10 10:39:17 首次发布

本文链接：https://blog.csdn.net/qq_35370485/article/details/130584482

版权

大数据学习之路专栏收录该内容

30 篇文章 4 订阅

订阅专栏

文章介绍了Chunjun插件的下载、解压及配置过程，特别是如何设置MySQL到HDFS的数据同步脚本，包括reader和writer参数。在local模式下启动同步任务，成功将数据从MySQL迁移到了HDFS。

摘要由CSDN通过智能技术生成

chunjun (纯钧) 官方文档纯钧

chunjun 有四种运行方式：local、standalone、yarn session、yarn pre-job 。

运行方式/环境依赖	flink环境	hadoop环境
local	×	×
standalone	√	×
yarn session	√	√
yarn pre-job	√	√

1.下载

官网已经提供了编译好的插件压缩包，可以直接下载：https://github.com/DTStack/chunjun/releases

chunjun-dist-1.12-SNAPSHOT.tar.gz

2.解压

先创建 chunjun 目录

再解压 chunjun-dist-1.12-SNAPSHOT.tar.gz 到 chunjun 这个目录当中

 tar -zxvf chunjun-dist-1.12-SNAPSHOT.tar.gz -C ../module/chunjun

查看目录结构：config 是自己创建的，取什么名称都行，里面放置脚本文件

3.案例

mysql->hdfs （local）

根据chunjun 案例纯钧

编写 mysql 数据同步 hdfs 脚本

vim  config/mysql_hdfs_polling.json

脚本：

{
    "job":{
        "content":[
            {
                "reader":{
                    "name":"mysqlreader",
                    "parameter":{
                        "column":[
                            {
                                "name":"group_id",
                                "type":"varchar"
                            },
                            {
                                "name":"company_id",
                                "type":"varchar"
                            },
                            {
                                "name":"group_name",
                                "type":"varchar"
                            }
                        ],
                        "username":"root",
                        "password":"000000",
                        "queryTimeOut":2000,
                        "connection":[
                            {
                                "jdbcUrl":[
                                    "jdbc:mysql://192.168.233.130:3306/gmall?characterEncoding=UTF-8&autoReconnect=true&failOverReadOnly=false"
                                ],
                                "table":[
                                    "cus_group_info"
                                ]
                            }
                        ],
                        "polling":false,
                        "pollingInterval":3000
                    }
                },
                "writer":{
                    "name":"hdfswriter",
                    "parameter":{
                        "fileType":"text",
                        "path":"hdfs://192.168.233.130:8020/user/hive/warehouse/stg.db/cus_group_info",
                        "defaultFS":"hdfs://192.168.233.130:8020",
                        "fileName":"cus_group_info",
                        "fieldDelimiter":",",
                        "encoding":"utf-8",
                        "writeMode":"overwrite",
                        "column":[
                            {
                                "name":"group_id",
                                "type":"VARCHAR"
                            },
                            {
                                "name":"company_id",
                                "type":"VARCHAR"
                            },
                            {
                                "name":"group_name",
                                "type":"VARCHAR"
                            }
                        ]
                    }
                }
            }
        ],
        "setting":{
            "speed":{
                "readerChannel":1,
                "writerChannel":1
            }
        }
    }
}

启动：

sh bin/chunjun-local.sh -job config/mysql_hdfs_polling.json

运行日志：

HDFS上的文件：

数据同步成功！

只爱大锅饭

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
Chunjun数据同步工具初体验

chunjun (纯钧) 官方文档chunjun 有四种运行方式：local、standalone、yarn session、yarn pre-job。
复制链接

扫一扫

专栏目录