介绍:DataX是阿里巴巴开源的一个异构数据源离线同步工具,主要致力于实现包括关系型数据库(如MySQL、Oracle等)、HDFS、Hive、ODPS、HBase、FTP等各种异构数据源之间稳定高效的数据同步功能。
该工具的设计理念是将复杂的网状同步链路变成星型数据链路,使DataX作为中间传输载体负责连接各种数据源。当需要接入一个新的数据源时,只需要将此数据源对接到DataX,便能跟已有的数据源进行无缝数据同步。这样的设计不仅解决了异构数据源同步问题,而且提高了数据同步的效率和稳定性。
1、github网站
网址:https://github.com/alibaba/DataX/blob/master/introduction.md
1.1 介绍
1.2 文档使用方法
1.3 插件开发宝典
2、博客园
网址:https://www.cnblogs.com/liugp/p/16303667.html
2.1 知识点及语法知识点
2.2 使用方法
3、csdn 网站
网址:https://waterwang.blog.csdn.net/article/details/114630690
3.1 阿里-DataX源码解读汇总
3.2 具体内容
4、学习视频推荐
1、【尚硅谷】Alibaba开源数据同步工具DataX技术教程
网址:https://www.bilibili.com/video/BV1H44y1x76X/?spm_id_from=333.337.search-card.all.click&vd_source=849186cc0cbe77dd51dcd8d1dc63a69b
2、千锋教育大数据DataX数据同步数据分析快速入门教程
网址:https://www.bilibili.com/video/BV1du411a7hX?p=2&vd_source=849186cc0cbe77dd51dcd8d1dc63a69b
以上就是个人觉得不错的学习网站,希望能帮到学习大数据的人!