datax官方文档_DATAX的一个完整实践记录

最新推荐文章于 2024-06-09 23:57:58 发布

weixin_39863155

最新推荐文章于 2024-06-09 23:57:58 发布

阅读量7.4k

点赞数

文章标签： datax官方文档

本文链接：https://blog.csdn.net/weixin_39863155/article/details/113055828

版权

缘起：

近期生产系统有从其他系统获取数据进行功能判断的依据。基于个人坚持的系统之间尽量解耦的原则，果断建议了etl同步方式。因为之前对kettle+taskctl方式比较熟悉，也对商业的DataPipeline有过一定的接触和了解，因此这次果断选择了datax。一个是基于对datax的了解，一个是基于要丰富自己能力(*^▽^*)。

记录：

一、datax安装部署

https://github.com/alibaba/DataX/blob/master/userGuid.md看这个官方的文档就足够了。简单说就是开箱即用。非常方便。注意：python版本 建议2.6python在3.0版本进行了语句的调整，和2.*的版本差异比较大，导致2.*的python是无法在环境是3.0的机器上运行的。下附suse或者readhat的安装python 2.7的方法：wget https://www.python.org/ftp/python/2.7.14/Python-2.7.14.tgz # Downloadtar xvfz Python-2.7.14.tgz # unzipcd Python-2.7.14 # go into directory./configuremake # buildsu # or 'sudo su' if there is no root usermake altinstall

二、mysql到mysql的数据同步

这块分两部分介绍

datax的同步脚本，供学习者学习；
针对我的这个业务场景的补偿机制，供参考；

{
    "job": {
            "setting": {

最低0.47元/天解锁文章

weixin_39863155

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
datax官方文档_DATAX的一个完整实践记录

缘起：近期生产系统有从其他系统获取数据进行功能判断的依据。基于个人坚持的系统之间尽量解耦的原则，果断建议了etl同步方式。因为之前对kettle+taskctl方式比较熟悉，也对商业的DataPipeline有过一定的接触和了解，因此这次果断选择了datax。一个是基于对datax的了解，一个是基于要丰富自己能力(*^▽^*)。记录：一、datax安装部署https://github.c...
复制链接

扫一扫