大数据之路----3.数据同步

最新推荐文章于 2023-08-18 07:56:43 发布

noworldling

最新推荐文章于 2023-08-18 07:56:43 发布

阅读量1.2k

点赞数

分类专栏：大数据数据仓库数据结构文章标签：大数据数据仓库数据库

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_46002001/article/details/125653266

版权

文章目录

数据来源
数据同步
数据仓库同步方式
- 批量数据同步
- 实时数据同步
数据同步遇到的问题和解决办法

数据来源

关系型数据库的结构化数据：MySQL、Oracle、DB2、SQL Server
非关系型数据库的非结构化数据：OceanBase、HBase、MongoDB、来源于文件系统的结构化或非结构化数据（通常以文件形式存储）

数据同步

直连同步

通过定义好的规范接口API和**基于动态链接库的方式（ODBC/JDBC等）**连接业务库。直连同步示意图如下图所示：

优点：配置简单，实现容易。适合操作性业务系统的数据同步。
缺点：对源系统的性能影响较大，当数据量较大时，不适合从业务系统到数据仓库系统的同步。

数据文件同步

通过设定好的文件编码、大小、格式等，直接从源系统生成数据的文本文件，由文件服务器传输到目标系统并加载到目标数据库系统中。数据文件同步示意图如下所示：

在这里插入图片描述
应用场景：当数据源包含多个异构的数据库系统（如MySQL、Oracle、SQL Server等）
优点：简单实用。互联网的日志类数据通常以文本形式存储，适合使用数据文件同步方式。

数据库日志解析同步

数据文件被传输到目标系统后，可通过数据加载模块完成数据的导入，从而实现数据从源系统到目标系统的同步。

在这里插入图片描述
优点：
1.日志文件信息

最低0.47元/天解锁文章

关注

0
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

noworldling CSDN认证博客专家 CSDN认证企业博客

码龄5年

59: 原创

39万+: 周排名

97万+: 总排名

7万+: 访问

: 等级

674: 积分

215: 粉丝

61: 获赞

12: 评论

442: 收藏

私信

关注

热门文章

分类专栏

hadoop 20篇
大数据 26篇
mapreduce 9篇
刷题 16篇
算法 2篇
数据结构 10篇
zookeeper 2篇
数据仓库 7篇
Spark 1篇
剑指offer 10篇
面向对象 10篇
Java 13篇
stream
二叉树 1篇
继承 6篇
力扣 5篇
hive 1篇
李宏毅

最新评论

数据中台详解
JeffStarmGo: 有点抽象，要是有实例来解析就好了
MAC利用VM进行Hadoop集群搭建保姆级教程（1）-----模板虚拟机环境准备
百日萌新786: 没有user目录呀吗是不是usr目录？
MAC利用VM进行Hadoop集群搭建保姆级教程（2）-----静态IP配置
qiaomaiya: 你好，想问一下，为什么我的Mac主机无法访问虚拟机呢？不是ssh root@虚拟机IP地址不就可以了吗，我的虚拟机之间可以pin通，希望大佬解答
数据中台详解
Kyrie_wen: 感谢讲解，有跟着文章介绍下载觉得datax还是挺不错的支持分布式部署，稳定性好，支持高可用性和容错性，也下了另外几个talend、informatica，etlcloud这几个平台，针对这个板块去做尝试，对数据中台有大概的理解
Java斗地主案列分析
2201_75961072: 牌的花色要怎么输入？

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。