大数据学习教程SD版第八篇【DataX】

DataX是一款由Java编写的,用于数据同步的工具,支持多种数据源如MySQL、HDFS等。它采用插件式架构,允许自定义Reader和Writer。DataX与Sqoop相比,具备更多数据源支持且单进程多线程。安装包括直接下载和源码编译两种方式。配置Job涉及reader、writer和setting,通过Json模板进行设定。在数据一致性方面,DataX使用临时文件确保任务完整性。实例中展示了MySQL到HDFS及HDFS到MySQL的数据迁移。分组算法实现负载均衡,优化包括提升Channel速度和并发数,以及调整JVM堆内存。
摘要由CSDN通过智能技术生成

DataX 采用Java编写的工具,使用Python调用功能,修改JSON配置即可使用

数据同步工具 支持:异构数据源、HDFS等 插件式

常用的数据源:MySQL、SQLServer、HDFS、Hive、Hbase、FTP 等

1. DataX 数据源

几乎所有数据源都支持,不支持的也可以自定义Reader和Writer,来支持!常用数据源有:

常用数据源
MySQL、SQLServer、Oracle
Hbase、Phoenix、MongoDB、Hive
FTP、HDFS
ES
Clickhouse

读写插件均在 plugin/reader/ 和 plugin/writer/ 中

reader writer
cassandrareader
clickhousereader
drdsreader
ftpreader
hbase094xreader
hbase11xreader
hbase11xsqlreader
hbase20xsqlreader
hdfsreader
kingbaseesreader
mongodbreader
mysqlreader
odpsreader
opentsdbreader
oraclereader
ossreader
otsreader
otsstreamreader
postgresqlreader
rdbmsreader
sqlserverreader
streamreader
txtfilereader
adbpgwriter
adswriter
cassandrawriter
clickhousewriter
drdswriter
elasticsearchwriter
ftpwriter
hbase094xwriter
hbase11xsqlwriter
hbase11xwriter
hbase20xsqlwriter
hdfswriter
hologresjdbcwriter
kafkawriter
kingbaseeswriter
mongodbwriter
mysqlwriter
ocswriter
odpswriter
oraclewriter
osswriter
otswriter
postgresqlwriter
rdbmswriter
sqlserverwriter
streamwriter
tsdbwriter
txtfilewriter

2. DataX 架构

  1. Reader 读
  2. Writer 写
  3. Framework 通道
  • Job 单个作业管理节点

  • Task 有Job Split 而来,最小单元 包括:reader、channel、writer

  • Schedule 将Task组成TaskGroup ,单个TaskGroup 默认并发为5

  • TaskGroup 启动内部的Task

3. DataX VS Sqoop

DataX:Java 单进程多线程,单机,数据源种类众多

Sqoop:MR,分布式,数据源种类较少

功能 DataX Sqoop
MySQL读写 单机压力大,粒度容易控制 MR 模式重,写出错处理困难
Hive读写 单机压力大 很好
文件格式 支持ORC 默认不支持ORC,可以添加
流控、信息、校验 有流控、有一些、core有校验功能 需要定制,没有
监控 需要定制 需要定制
后续 有改动,持续优化 基本完善,已经停止

4. DataX 安装

  1. 从Github下载tar.gz,并解压安装包方式
  • 使用测试
python datax.py ../job/job.json
  • 报错问题
经DataX智能分
  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

道-闇影

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值