datax安装部署

一 前置准备

1、Linux下jdk的安装

2、Linux下Python的安装 (官方推荐2.6.x),实际其他版本目前也可以,本机自带python2.7,使用也是此版本

3、Hadoop完全分布式集群环境

二 安装

源码地址:https://github.com/alibaba/DataX

这 里 我 下 载 的 是 最 新 版 本 的 DataX3.0 。 下 载 地 址 为 : http://datax-opensource.oss-cn-hangzhou.aliyuncs.com/datax.tar.gz

1、 下载后解压
tar -zxvf /kkb/soft/datax.tar.gz -C  /kkb/install/
2、运行自检脚本
cd /kkb/install/datax
./bin/datax.py  ./job/job.json

出现以下界面说明DataX安装成功

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-2eAXnUMK-1617239312714)(datax安装部署.assets/datax安装成功.png)]

三 基本使用

3.1 从stream读取数据并打印到控制台
1、查看官方模板
cd /kkb/install/datax
python ./bin/datax.py  -r streamreader -w streamwriter
{
    "job": {
        "content": [
            {
                "reader": {
                    "name": "streamreader", 
                    "parameter": {
                        "column": [], 
                        "sliceRecordCount": ""
                    }
                }, 
                "writer": {
                    "name": "streamwriter", 
                    "parameter": {
                        "encoding": "", 
                        "print": true
                    }
                }
            }
        ], 
        "setting": {
            "speed": {
                "channel": ""
            }
        }
    }
}
2、新建json文件
vim stream2stream.json

{
    "job": {
        "content": [
            {
            
  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值