对GoldenGate实例进行监控,最简单的办法是通过GGSCI命令行的方式进行。
GGSCI就类似于我们SQLPLUS
是GG的控制台
通过在命令行输入一系统命令,并查看返回信息
来判断GOLDENGATE运行情况是否正常
命令行返回的信息包括整体概况、进程运行状态
检查点信息、参数文件配置、延时等
除了直接通过主机登录GGSCI界面之外
并运行GGSCI命令
也可以通过GOLDENGATE DIRECTOR WEB界面登陆到每个GOLDENGATE实例
2.2 启动GoldenGate进程
1) 首先以启动GoldenGate进程的系统用户(一般为oracle)登录源系统。
2) 进入GoldenGate安装目录,执行./ggsci进入命令行模式。
3) 启动源端管理进程GGSCI > start mgr
4) 同样登陆到目标端GoldenGate安装目录,执行./ggsci,然后执行GGSCI >
start mgr启动管理进程。
5) 在源端执行GGSCI > start er *启动所有进程
6) 同样登录到备份端执行GGSCI > start er *启动所有进程
7) 使用GGSCI > info er * 或者 GGSCI >
info
察看进程状态是否为Running(表示已经启动)。
注意有的进程需要几分钟起来,请重复命令观察其启动状态
说明:无论源还是目标,启动各extract/replicat进程前需要启动mgr进程。
start 命令的一般用法是:start
如:
GGSCI> start extdm 启动一个名叫extdm的进程
也可以使用START *来启动所有进程
启动进程就讲到这里,下面讲下停止进程
2.3 停止GoldenGate进程
依照以下步骤停止GoldenGate进程:
1)
以启动GoldenGate进程的系统用户(一般为oracle)登录源主机,进入GoldenGate安装目录执行./ggsci进入命令行管理界面
2) (本步骤仅针对抽取日志的主extract进程, data
pump进程和replicat进程不需要本步骤)验证GoldenGate的抽取进程重起所需的日志存在,对各个主extXX进程,执行如下命令:
ggsci> info extXX, showch
首先察看Recovery
Checkpoint所需要读取的最古老日志序列号,如举例中的实例1需要日志9671及其以后所有归档日志
实例2需要序列号为5287及以后所有归档日志,确认这些归档日志存在于归档日志目录后才可以执行下一步重起。
如果这些日志已经被删除,则下次重新启动需要先恢复归档日志。
3) 执行GGSCI >stop er *停止所有源进程,或者分别对各个进程执行stop
单独停止。
4)
以oracle用户登录目标系统,进入安装目录/oraclelog1/goldengate,执行./ggsci进入命令行。
5) 在目标系统执行stop er *停止复制
6) 在两端进程都已停止的情况下,如需要可通过stop mgr停止各系统内的管理进程。
类似的,stop命令具有跟start命令一样的用法。
注意,如果是只修改抽取或者复制进程参数,则不需要停止MGR。
不要轻易停止MGR进程,并且慎重使用通配符er *, 以免对其他复制进程造成不利影响。
所以我们最好是单个单个地停进程
2.4 查看整体运行情况
进入到GoldenGate安装目录,运行GGSCI,然后使用info all命令查看整体运行情况。如下图示:
Group表示进程的名称(MGR进程不显示名字);Lag表示进程的延时;Status表示进程的状态。
有四种状态:
STARTING: 表示正在启动过程中
RUNNING:表示进程正常运行
STOPPED:表示进程被正常关闭
ABENDED:表示进程非正常关闭,需要进一步调查原因
正常情况下,所有进程的状态应该为RUNNING,且Lag应该在一个合理的范围内。
2.5 查看参数设置
使用view params
可以查看进程的参数设置。
2.6 查看进程状态
使用info
命令可以查看进程信息。可以查看到的信息包括进程状态、checkpoint信息、延时等。如:
还可以使用info detail
命令查看更详细的信息。
包括所使用的trail文件,参数文件、报告文件、警告日志的位置等。
使用info showch
命令可以查看到详细的关于checkpoint的信息
用于查看GoldenGate进程处理过的事务记录
其中比较重要的是extract进程的recovery checkpoint,它表示源数据中最早的未被处理的事务;
通过recovery checkpoint可以查看到该事务的redo log位于哪个日志文件以及该日志文件的序列号。
所有序列号比它大的日志文件,均需要保留。
2.7 查看延时
GGSCI> lag
可以查看详细的延时信息。
此命令比用info命令查看到的延时信息更加精确。
注意,此命令只能够查看到最后一条处理过的记录的延时信息。
此命令支持通配符 *。 2.8 查看统计信息
GGSCI> stats
,,table
.
name> 可以查看进程处理的记录数。
该报告会详细的列出处理的类型和记录数。如:
GGSCI> stats edr, total列出自进程启动以来处理的所有记录数。
GGSCI> stats edr, daily, table
gg.test列出当天以来处理的有关gg.test表的所有记录数。
2.9 查看运行报告
GGSCI> view report
可以查看运行报告。如:
也可以进入到
/dirrpt/目录下,查看对应的报告文件。
最新的报告总是以.rpt命名的。
加后缀数字的报告是历史报告,数字越大对应的时间越久。
如果进程运行时有错误,则报告文件中会包括错误代码和详细的错误诊断信息。
通过查找错误代码,可以帮助定位错误原因,解决问题。