dataX安装部署以及简单使用

本文详细介绍了DataX的安装步骤,包括环境准备、下载解压和自检脚本的运行。在环境准备中,提到了需要JDK 1.8和Python 2.6.x。在解决问题部分,指出了运行自检脚本可能出现的错误及解决方案。然后展示了如何配置从Oracle数据库到HBase的数据同步任务,并提供了相应的JSON配置文件示例。最后,通过运行采集脚本成功完成了数据同步任务。
摘要由CSDN通过智能技术生成

dataX安装部署以及简单使用

部署安装

环境准备
  1. jdk(1.8以上,推荐1.8)
  2. python(推荐python2.6.x)
下载并解压

源码地址:https://github.com/alibaba/DataX

本文中部署使用的是DataX3.0,下载地址为:http://datax-opensource.oss-cn-hangzhou.aliyuncs.com/datax.tar.gz

# 下载后进行解压
tar -zxvf datax.tar.gz -C /opt/software/
运行自检脚本
cd /opt/software/datax/
bin/datax.py job/job.json

运行自检脚本可能会出现的错误

在这里插入图片描述

上述图中运行自检脚本错误为:/opt/software/datax/plugin/reader/._hbase094xreader/plugin.json文件不存在

原因:DataX3.0版本使用的是hbase11xreader/hbase11xwriter

解决方法:

# 删除datax/plugin/reader下所有._前缀的文件,因为该文件夹下会有隐藏的jar包,所以用._*er方式进行匹配
find /opt/module/datax/plugin/reader/ -type f -name "._*er" | xargs rm -rf
# 删除datax/plugin/writer下所有._前缀的文件,因为该文件夹下会有隐藏的jar包,所以用._*er方式进行匹配
find /opt/module/datax/plugin/writer/ -type f -name "._*er" | xargs rm -rf

关系型数据库数据同步至hbase

oracle数据库
json配置文件
{
    "job":{
        "setting":{ "speed": { "channel":5  } },
        "content":[{
                "reader":{
                    "name":"oraclereader",
                    "parameter":{
                        "username":"cbuser",
                        "password":"cbuser",
                        "connection":[
                            {
                                "jdbcUrl":[ "jdbc:oracle:thin:@10.1.2.41:1521/test1"],
                                "querySql":[
                                    "select * from demo"
                                ]
                            }
                        ]
                    }
                },
                "writer":{
			"name":"hbase11xwriter",
			"parameter":{
				"hbaseConfig":{"hbase.zookeeper.quorum":"10.1.2.51:2181"},
				"table":"collection:offLine_Acq_test_demo",
				"mode":"normal",
				"rowkeyColumn":[{"index":0,"type":"string"}],
				"column":[
					{"index":1,"name":"f:name","type":"string"}
					],
				"encoding":"utf-8"
			}
		}
	}]
    }
}
运行采集脚本
/opt/software/datax/bin/datax.py /opt/software/datax/conf/oracle.json

任务成功显示

在这里插入图片描述

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值