物流项目中Oracle 数据库的使用及OGG是如何同步_oracle ogg数据同步(1)

img
img

网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。

需要这份系统化资料的朋友,可以戳这里获取

一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!

1612320791630

​ OGG 能够实现大量交易数据的实时捕捉,变换和投递,实现源数据库与目标数据库的数据同步,保持最少10ms的数据延迟。

1615776620433

应用场景:主要三个方面

  • 高可用(HA:High Availability)容灾
  • 数据库迁移、升级(支持跨版本、异构数据库、零宕机时间、亚秒级恢复)
  • 实时数据集成(支持异构数据库、多源数据库)

1615776882220

07-[掌握]-OGG 数据同步之基本原理及架构

​ Oracle GoldenGate 实现原理是通过抽取源端的redo log 或者 archive log ,然后通过TCP/IP投递到目标端,最后解析还原应用到目标端,使目标端实现 同源端数据同步。

详细OGG如何数据同步,基本原理和架构:

  • 1)、源端(SRC):获取Oracle数据表数据,从日志文件获取
    • 管理者:MGR(Manger)
    • 第一、进程:Extract提取进程,获取日志数据文件
    • 第二、本地缓存:Local TrailFile,将日志文件数据存储到本地TrailFile文件中,缓存
    • 第三、进程:(可选)Pump进程,将本地Local TrailFile发送给目标端
  • 2)、目标端(DST):发送数据到目标,如Topic
    • 管理者:MGR(Manger)
    • 第一、进程:Collect进程,接收源端pump进程发送的数据,新版添加进程
    • 第二、远程缓存:RemoteTrailFile,目标端接收到数据文件以后,进行缓存
    • 第三、进程:Replicat进程,复制进程,解析RemoteTrailFile文件,转换JSON格式,发送到Kafka

1612321610205

OGG采集数据时,完整结构如上如所示:分为源端SRC和目标端DST,都有自己管理进程MGR。

1615777550837

Extract 进程用来捕获数据源,有三种类型:

  • 1)、initial load:加载整张表的数据,属于批量加载
  • 2)、恢复日志/事务日志:恢复数据库表的数据
  • 3)、捕获模型,实时监控日志文件,已有数据,立即捕获

1615777650890

Data pump 是Extract的辅助可选组件,如果不配置Data pump,Extract将捕获的数据直接发给目标机器上的Collector进程。

08-[理解]-OGG 数据同步之拓扑结构及支持环境

​ OGG架构和原理,发现架构划分比较细(分工比较细),OGG在实际项目中,使用时,常见拓扑结构和支持环境,以后如果考虑使用OGG实时同步数据时参考。

Oracle数据库配置集群Cluster,称为Oracle RAC(Real Application Cluster

1615778086744

​ 由此可见,GoldenGate TDM的复制模式非常灵活,用户可以根据自己的需求选择特定的复制方式,并根据系统扩展对复制进行扩展。

源和目标的操作系统和数据库可以进行任意的组合。

1615778445595

​ 目前来说,如果企业项目使用OGG进行数据同步时,通常还是SRC为:Oracle数据库,DST:Oracle数据库或Kafka消息队列。

09-[掌握]-OGG 数据同步之测试环境准备

如何配置OGG实现实时数据同步到Kafka,无需掌握步骤,比较繁琐,让DBA完成。

1615779520603

​ 提供虚拟机【node1.itcast.cn】中Docker 容器【myoracle】已经安装完OGG(源端和目标端),只需要启动OGG的源端SRC服务和目标端DST服务即可。

  • 1)、源端SRC
    • Manager管理(mgr)、Extract进程、LocalTrail、Pump进程
  • 2)、目标端DST
    • Manager管理(mgr)、Remote Trail 、复制进程Replicat

1612324623208

​ 由于使用OGG实时采集Oracle数据库表数据(日志文件),将数据同步到Kafka消息对象,所以首先启动Kafka服务(先启动Zookeeper服务),打开提供【node2.itcast.cn】,使用CM界面启动ZK和Kafka服务。

1615779939494

启动OGG配置服务,分为源端和目标端,参考提供【启动命令:Oracle数据库和OGG服务.txt】,具体命令;

#  ============= 切换到 oracle 账号,并且启动Oracle数据库 =============

# 第一步:启动源端mgr进程
[root@node1 ~]# docker exec -it myoracle /bin/bash
[root@server01 oracle]# su - oracle
Last login: Mon Mar 15 02:06:07 UTC 2021 on pts/1
-bash: warning: setlocale: LC_ALL: cannot change locale (en_US): No such file or directory
-bash: warning: setlocale: LC_ALL: cannot change locale (en_US): No such file or directory
[oracle@server01 ~]$ cd $OGG_SRC_HOME
[oracle@server01 src]$ ./ggsci 

Oracle GoldenGate Command Interpreter for Oracle
Version 11.2.1.0.3 14400833 OGGCORE_11.2.1.0.3_PLATFORMS_120823.1258_FBO
Linux, x64, 64bit (optimized), Oracle 11g on Aug 23 2012 20:20:21

Copyright (C) 1995, 2012, Oracle and/or its affiliates. All rights reserved.



GGSCI (server01) 1> start mgr

Manager started.


GGSCI (server01) 2> info all

Program     Status      Group       Lag at Chkpt  Time Since Chkpt

MANAGER     RUNNING                                           
EXTRACT     ABENDED     EXTKAFKA    00:00:00      4598:05:35  
EXTRACT     ABENDED     PUKAFKA     00:00:00      4598:05:31  


# 第二步:启动目标端mgr进程
[root@node1 ~]# docker exec -it myoracle /bin/bash
[root@server01 oracle]# su - oracle
Last login: Mon Mar 15 03:48:01 UTC 2021 on pts/0
-bash: warning: setlocale: LC_ALL: cannot change locale (en_US): No such file or directory
-bash: warning: setlocale: LC_ALL: cannot change locale (en_US): No such file or directory
[oracle@server01 ~]$ cd $OGG_TGR_HOME
[oracle@server01 tgr]$ ./ggsci
start mgrOracle GoldenGate for Big Data
Version 12.3.1.1.1

Oracle GoldenGate Command Interpreter
Version 12.3.0.1.0 OGGCORE_OGGADP.12.3.0.1.0GA_PLATFORMS_170828.1608
Linux, x64, 64bit (optimized), Generic on Aug 28 2017 17:13:45
Operating system character set identified as US-ASCII.

Copyright (C) 1995, 2017, Oracle and/or its affiliates. All rights reserved.


GGSCI (server01) 2> start mgr
Manager started.


GGSCI (server01) 3> info all

Program     Status      Group       Lag at Chkpt  Time Since Chkpt

MANAGER     RUNNING                                           
REPLICAT    ABENDED     REKAFKA     00:00:00      4598:06:12  


# 第三步:启动源端extract进程
GGSCI (server01) 3> start EXTKAFKA

Sending START request to MANAGER ...
EXTRACT EXTKAFKA starting


# 第四步:启动源端pump进程
GGSCI (server01) 4> start PUKAFKA

Sending START request to MANAGER ...
EXTRACT PUKAFKA starting


GGSCI (server01) 5> info all

Program     Status      Group       Lag at Chkpt  Time Since Chkpt

MANAGER     RUNNING                                           
EXTRACT     RUNNING     EXTKAFKA    4598:08:10    00:00:00    
EXTRACT     RUNNING     PUKAFKA     00:00:00      4598:07:38  


# 第五步:启动目标端replicate进程
GGSCI (server01) 4> start REKAFKA

Sending START request to MANAGER ...
REPLICAT REKAFKA starting


GGSCI (server01) 7> info all

Program     Status      Group       Lag at Chkpt  Time Since Chkpt

MANAGER     RUNNING                                           
REPLICAT    RUNNING     REKAFKA     00:00:00      00:00:08    


使用KafkaTool工具连接Kafka集群,查看Topic信息和数据

1615780362820

10-[掌握]-OGG 数据同步之物流数据同步Kafka

采用OGG中间件将Oracle数据库表的数据实时同步到Kafka消息队列中:

  • 1)、源端 :Oracle数据库【itcast】
  • 2)、采集工具:OGG,分为SRC和DST
  • 3)、目标端:Kafka 消息队列【logistics】

测试:向Oracle数据库某张表中插入insert、更新update及删除delete操作,查看Kafka Topic中数据

目前OGG11版本,延迟性相对较大,在2s左右,需要进行合理化调参配置,到OGG12版本,很快。

  • 1)、插入数据测试
-- 插入数据INSERT
INSERT INTO ITCAST."tbl_company"("id", "company_name", "city_id", "company_number", "company_addr", "company_addr_gis", "company_tel", "is_sub_company", "state", "cdt", "udt", "remark")VALUES(11, '广州码农速递邮箱公司', 440100, NULL, '广州校区', '117.28177895734918_31.842711680531399', NULL, 1, 1, TO_DATE('2020-06-13 15:24:51','yyyy-mm-dd hh24:mi:ss'), TO_DATE('2020-06-13 15:24:51','yyyy-mm-dd hh24:mi:ss'), NULL);


同步至Kafka Topic中JSON数据

{
  "table": "ITCAST.tbl\_company",
  "op\_type": "I",
  "op\_ts": "2021-03-15 03:57:07.000306",
  "current\_ts": "2021-03-15T03:57:20.578000",
  "pos": "00000000150000001245",
  "after": {
    "id": 11,
    "company\_name": "广州码农速递邮箱公司",
    "city\_id": 440100,
    "company\_number": null,
    "company\_addr": "广州校区",
    "company\_addr\_gis": "117.28177895734918\_31.842711680531399",
    "company\_tel": null,
    "is\_sub\_company": 1,
    "state": 1,
    "cdt": "2020-06-13 15:24:51",
    "udt": "2020-06-13 15:24:51",
    "remark": null
  }
}

  • 2)、更新数据测试
-- 更新数据UPDATE
UPDATE ITCAST."tbl_company" SET "company_name"='广州码农速递有限公司-1' WHERE "id"=11;


同步至Kafka Topic中JSON数据

{
  "table": "ITCAST.tbl\_company",
  "op\_type": "U",
  "op\_ts": "2021-03-15 03:59:28.000248",
  "current\_ts": "2021-03-15T03:59:40.378000",
  "pos": "00000000150000001980",
  "before": {
    "id": 11,
    "company\_name": "广州码农速递邮箱公司",
    "city\_id": 440100,
    "company\_number": null,
    "company\_addr": "广州校区",
    "company\_addr\_gis": "117.28177895734918\_31.842711680531399",
    "company\_tel": null,
    "is\_sub\_company": 1,
    "state": 1,
    "cdt": "2020-06-13 15:24:51",
    "udt": "2020-06-13 15:24:51",
    "remark": null
  },
  "after": {
    "id": 11,
    "company\_name": "广州码农速递有限公司-1",
    "city\_id": 440100,
    "company\_number": null,
    "company\_addr": "广州校区",
    "company\_addr\_gis": "117.28177895734918\_31.842711680531399",
    "company\_tel": null,
    "is\_sub\_company": 1,


![img](https://img-blog.csdnimg.cn/img_convert/82084f09a4a61e47bf99edf775407bfd.png)
![img](https://img-blog.csdnimg.cn/img_convert/b3c96b2b3d6a93ba847e121169eafcd7.png)

**网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。**

**[需要这份系统化资料的朋友,可以戳这里获取](https://bbs.csdn.net/topics/618545628)**


**一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!**

mpany\_addr\_gis": "117.28177895734918\_31.842711680531399",
    "company\_tel": null,
    "is\_sub\_company": 1,


[外链图片转存中...(img-vY7iaYyE-1715828949396)]
[外链图片转存中...(img-5ASLcGu7-1715828949397)]

**网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。**

**[需要这份系统化资料的朋友,可以戳这里获取](https://bbs.csdn.net/topics/618545628)**


**一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!**

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值