datax安装部署

最新推荐文章于 2024-07-25 16:06:56 发布

了因和尚

最新推荐文章于 2024-07-25 16:06:56 发布

阅读量1.9k

点赞数

文章标签： mysql hdfs hadoop python

本文链接：https://blog.csdn.net/qq_31904559/article/details/115366225

版权

一前置准备

1、Linux下jdk的安装

2、Linux下Python的安装 (官方推荐2.6.x),实际其他版本目前也可以，本机自带python2.7,使用也是此版本

3、Hadoop完全分布式集群环境

二安装

源码地址：https://github.com/alibaba/DataX

这里我下载的是最新版本的 DataX3.0 。下载地址为： http://datax-opensource.oss-cn-hangzhou.aliyuncs.com/datax.tar.gz

1、下载后解压

tar -zxvf /kkb/soft/datax.tar.gz -C  /kkb/install/

2、运行自检脚本

cd /kkb/install/datax
./bin/datax.py  ./job/job.json

出现以下界面说明DataX安装成功

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-2eAXnUMK-1617239312714)(datax安装部署.assets/datax安装成功.png)]

三基本使用

3.1 从stream读取数据并打印到控制台

1、查看官方模板

cd /kkb/install/datax
python ./bin/datax.py  -r streamreader -w streamwriter

{
    "job": {
        "content": [
            {
                "reader": {
                    "name": "streamreader", 
                    "parameter": {
                        "column": [], 
                        "sliceRecordCount": ""
                    }
                }, 
                "writer": {
                    "name": "streamwriter", 
                    "parameter": {
                        "encoding": "", 
                        "print": true
                    }
                }
            }
        ], 
        "setting": {
            "speed": {
                "channel": ""
            }
        }
    }
}

2、新建json文件

vim stream2stream.json

{
    "job": {
        "content": [
            {

最低0.47元/天解锁文章

了因和尚

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
datax安装部署

一前置准备1、Linux下jdk的安装2、Linux下Python的安装 (官方推荐2.6.x),实际其他版本目前也可以，本机自带python2.7,使用也是此版本3、Hadoop完全分布式集群环境二安装源码地址：https://github.com/alibaba/DataX这里我下载的是最新版本的 DataX3.0 。下载地址为： http://datax-opensource.oss-cn-hangzhou.aliyuncs.com/datax.tar
复制链接

扫一扫