Oracle GoldenGate技术

1、概述

GoldenGate 现在是业内成熟的数据容灾与复制产品,被广泛地应用到金融行业及要求数据复制高效、健壮的各个行业。目前隶属于Oracle 公司融合中间件(Fusion Middleware)产品线。

2、产品组合

Oracle GoldenGate最为常见的家族成员包括GoldenGate GoldenGate Director(现名GoldenGate Management Pack)、 GoldenGate Veridata 。这三者并不是一个打包的产品。

  1. GoldenGate 产品是核心产品;
  2. GoldenGate Director为GoldenGate 提供友好的GUI 配置 管理界面;
  3. GoldenGate Veridata为GoldenGate 源端和目标端提供数据比对和校验的功能;

3、产品战略

可以与Oracle 原有的 Data Guard、 ODI 互为补充,共同为企业提供跨平台实时数据同步的解决方案;

可以与Oracle Real Application Cluster 、Data Guard 一起为用户提供丰富、灵活的容灾方案及高可用特性;

4、产品定位

  1. 零宕机时间数据库升级和迁移。
  2. 满足用户亚秒级实时数据的需求。
  3. 可持续的数据高可用性和实时商务智能。
  4. 异构平台及跨操作系统实时数据同步。
  5. 对源系统和目标系统是非侵入式的。

5、技术架构

和传统的逻辑复制一样,Oracle GoldenGate 实现原理是通过抽取源端的redo log 或者 archive log ,然后通过TCP/IP投递到目标端,最后解析还原应用到目标端,使目标端实现同源端数据同步。

下图:Oracle GoldenGate 的技术架构。

5.1 Manager进程

Manager进程是GoldenGate 的控制进程。如果把所有的 Oracle 进程比喻为军队,那么 Manager 就相当于司令。Manager 进程运行在源端和目标端上,它主要有以下几个方面的作用:启动、监控、重启GoldenGate 的其他进程,报告错误及事件,分配数据存储空间, 发布阈值报告等

每个源端或者目标端有且只能存在一个 Manager 进程。其运行状态有两种即 RUNNING(正在运行)和STOPPED(已经停止)。

在Windows 系统上,Manager进程是作为一个服务来启动的,而在类UNIX 系统中, Manager则是一个操作系统进程。

5.2 Extract 进程

Extract 运行在数据库源端,负责从源端数据表或者日志中捕获数据。在早期的 GoldenGate 版本中,它通常被称为Collect 进程。按照其所处的阶段不同,Extract 的作用可以按照时间来划分。

初始数据装载阶段:在初始数据装载阶段,Extract 进程直接从源端的数据表中抽取数据。

同步变化捕获阶段:初始数据同步完成以后,Extract 进程负责捕获源端数据的变化 (DML和DDL)。

Extract 进程利用其内在的checkpoint 机制,周期性地检查并记录其读写的位置,通常是写入到一个本地的trail 文件。这种机制是为了保证如果Extract 进程终止或者操作系统宕机,重新启动 Extract 进程后,GoldenGate 能够恢复到以前的状态,从上一个断点处继续 往下运行,而不会有任何数据损失

Extract 进程的状态包括STOPPED(正常停止)、STARTING (正在启动)、RUNNING (正在运行)、ABENDED (Abnomal End 的缩写,表示异常结束)。

5.3 Pump 进程

Pump 进程运行在数据库源端,其作用是:如果源端使用了本地的trail 文件, 那么Pump 进程就会把trail以数据块的形式通过TCP/IP协议发送到目标端,这通常也是推荐的方式。Pump 进程本质是Extract 进程的一种特殊形式,如果不使用trail 文件,那么就是Extract 进程在抽取完数据以后,直接投递到目标端

与Pump 进程相对应的叫做Server Collector 进程,这个进程不需要引起人们的关注, 因为在实际操作过程中无需对其进行任何配置,所以对人们来说它是透明的。它运行在目标端,其任务就是把 Extract/Pump 投递过来的数据块重新组装成trail 文件,人们称之为远 程trail文件。

5.4 Trail文件

为了更有效、更安全地把数据库事务信息从源端投递到目标端,GoldenGate 引进trail 文件的概念。前面提到Extract 抽取完数据以后GoldenGate 会将抽取的事务信息转化为一 种GoldenGate 专有格式的文件,然后Pump 负责把源端的trail 文件投递到目标端,所以源、 目标两端都会存在这种文件,源端存放的trail 文件叫本地trail 文件,目标端存放的trail 文件叫远程trail 文件trail 文件存在的目的旨在防止单点故障,将事务信息持久化,并且使用checkpoint 机制来记录其读写位置,如果故障发生,则数据可以根据checkpoint 记录的位置来重传

值得一提的是,trail 文件并不总是必须的。人们可以在配置Extract 进程的时候通过 TCP/IP协议直接把日志的信息投递到目标端。但通常并不推荐这么做,因为一旦发生系统宕机或者网络故障,则有可能造成数据的丢失。

5.5 Replicat 进程

Replicat 进程,通常也把它叫做应用进程。运行在目标端,是数据传递的最后一站, 负责读取目标端trail 文件中的内容,并将其解析为 DML或DDL语句,然后应用到目标数据库中

和Extract 进程一样,Replicat也有其内部的checkpoint 机制,保证进程重新启动后可以从上次记录的位置开始恢复,而无数据损失的风险。 它的运行状态和 Extract 进程一致,包括 STOPPED、STARTING 、RUNNING 、 ABENDED 。

5.6 GGSCI

GGSCI是GoldenGate Software Command Interface的缩写,它提供了十分丰富的命令来对GoldenGate 进行各种操作,如创建、修改、监控GoldenGate 进程等。

绝大部分的操作都是通过它来完成的。当然如果您需要GUI 方式的图形界面来管理, 则需要购买GoldenGate Director。

6、复制模式

GoldenGate 的模式包括多种,如下图:

其中“一对一”是 GoldenGate 最简单的 一种模式,也是最常用的模式。这种模式的一种典型应用就是用于数据容灾,通常源端数据库为生产端,目标端数据 库为容灾端。另外一种应用场景是把源端的OLTP系统产生的交易日志传送到目标端,使用BI数据仓库或者是OLAP。

7、应用情况

1.高可用性与容灾

  • 容灾与应急备份。
  • 消除计划内停机。
  • 双业务中心。
  • OLTP 和OLAP 分开。

2.主数据数据库移植、升级

3.实时数据集成

  • 数据仓库实时供给。
  • 实时报表。
  • 政府、企业垂直部门级数据同步。
  • 主数据。

注:本文是阅读《Oracle GoldenGate概述》后结合个人理解并整理所得,原文请查阅[https://blog.csdn.net/sunansheng/article/details/51854786]

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值