主备集群规范化部署

dsc+dw

choose switchover
Can choose one of the following instances to do switchover:
1: DSC_DG

INST_PORT INST_OK INAME ISTATUS
TAT_FLAG
5236 OK DSC0 OPEN

5236 OK DSC1 OPEN

switchover DSC0
DATABASE(DSC_DG) APPLY INFO FROM (DSC0):

总结

如果一直没有观察到主库守护进程发起 Recovery 流程,可以借助监视器的 check
recover 命令查找备库不满足条件的原因,

超时DW_ERROR_TIME 缺省 15 秒

备库拖慢主库
守护进程提供 RLOG_SEND_THRESHOLD 参数用于监控主备之间的日志发送速度配置为 0 时此监控功能关闭,默认值为 0 取值范围(0~86400),单位为秒,主库最近 N 次(N 不超过主库 dm.ini 设置的 RLOG_SEND_APPLY_MON 值)到某个归
档状态有效的备库控制节点发送归档的平均耗时超过设置的 RLOG_SEND_THRESHOLD 值。

备库重演相关判断
KSEQ 大于 SSEQ,就认为存在 KEEP_PKG
守护类型
本地守护:提供最基本的守护进程功能,监控本地数据库服务。
全局守护:
实时主备、MPP 主备和读写分离集群系统中,需要将守护进程配置为全局守护类型
全局守护类型在本地守护类型的基础上,通过和远程守护进程的交互,增加了主备库切换、主备库故障检测、备库接管、数据库故障重加入等功能。
配置全局守护类型后,守护进程守护的数据库实例,必须配置实时或即时归档,否则 dmwatcher 会启动失败。

异步备库
每个 Primary 或者 Standby 模式的库都可以配置最多 8 个异步备库

switchover TEST01
[monitor] 2021-04-13 17:11:13: 开始切换实例TEST01
[monitor] 2021-04-13 17:11:13: 通知守护进程TEST02切换SWITCHOVER状态
[monitor] 2021-04-13 17:11:13: 守护进程(TEST02)状态切换 [OPEN–>SWITCHOVER]
[monitor] 2021-04-13 17:11:14: 切换守护进程TEST02为SWITCHOVER状态成功
[monitor] 2021-04-13 17:11:14: 通知守护进程TEST01切换SWITCHOVER状态
[monitor] 2021-04-13 17:11:15: 守护进程(TEST01)状态切换 [OPEN–>SWITCHOVER]
[monitor] 2021-04-13 17:11:15: 切换守护进程TEST01为SWITCHOVER状态成功
[monitor] 2021-04-13 17:11:15: 实例TEST02开始执行SP_SET_GLOBAL_DW_STATUS(0, 6)语句
[monitor] 2021-04-13 17:11:16: 实例TEST02执行SP_SET_GLOBAL_DW_STATUS(0, 6)语句成功
[monitor] 2021-04-13 17:11:16: 实例TEST01开始执行SP_SET_GLOBAL_DW_STATUS(0, 6)语句
[monitor] 2021-04-13 17:11:16: 实例TEST01执行SP_SET_GLOBAL_DW_STATUS(0, 6)语句成功
[monitor] 2021-04-13 17:11:16: 实例TEST02开始执行ALTER DATABASE MOUNT语句
[monitor] 2021-04-13 17:11:19: 实例TEST02执行ALTER DATABASE MOUNT语句成功
[monitor] 2021-04-13 17:11:19: 实例TEST01开始执行SP_APPLY_KEEP_PKG()语句
[monitor] 2021-04-13 17:11:19: 实例TEST01执行SP_APPLY_KEEP_PKG()语句成功
[monitor] 2021-04-13 17:11:19: 实例TEST01开始执行ALTER DATABASE MOUNT语句
[monitor] 2021-04-13 17:11:21: 实例TEST01执行ALTER DATABASE MOUNT语句成功
[monitor] 2021-04-13 17:11:21: 实例TEST02开始执行ALTER DATABASE STANDBY语句
[monitor] 2021-04-13 17:11:22: 实例TEST02执行ALTER DATABASE STANDBY语句成功
[monitor] 2021-04-13 17:11:22: 实例TEST01开始执行ALTER DATABASE PRIMARY语句
[monitor] 2021-04-13 17:11:22: 实例TEST01执行ALTER DATABASE PRIMARY语句成功
[monitor] 2021-04-13 17:11:22: 通知实例TEST01修改所有归档状态无效
[monitor] 2021-04-13 17:11:22: 修改所有实例归档为无效状态成功
[monitor] 2021-04-13 17:11:22: 实例TEST02开始执行ALTER DATABASE OPEN FORCE语句
[monitor] 2021-04-13 17:11:22: 实例TEST02执行ALTER DATABASE OPEN FORCE语句成功
[monitor] 2021-04-13 17:11:22: 实例TEST01开始执行ALTER DATABASE OPEN FORCE语句
[monitor] 2021-04-13 17:11:24: 实例TEST01执行ALTER DATABASE OPEN FORCE语句成功
[monitor] 2021-04-13 17:11:24: 实例TEST02开始执行SP_SET_GLOBAL_DW_STATUS(6, 0)语句
[monitor] 2021-04-13 17:11:24: 实例TEST02执行SP_SET_GLOBAL_DW_STATUS(6, 0)语句成功
[monitor] 2021-04-13 17:11:24: 实例TEST01开始执行SP_SET_GLOBAL_DW_STATUS(6, 0)语句
[monitor] 2021-04-13 17:11:24: 实例TEST01执行SP_SET_GLOBAL_DW_STATUS(6, 0)语句成功
[monitor] 2021-04-13 17:11:24: 通知守护进程TEST02切换OPEN状态
[monitor] 2021-04-13 17:11:24: 守护进程(TEST02)状态切换 [SWITCHOVER–>OPEN]
[monitor] 2021-04-13 17:11:25: 切换守护进程TEST02为OPEN状态成功
[monitor] 2021-04-13 17:11:25: 通知守护进程TEST01切换OPEN状态
[monitor] 2021-04-13 17:11:26: 守护进程(TEST01)状态切换 [SWITCHOVER–>OPEN]
[monitor] 2021-04-13 17:11:27: 切换守护进程TEST01为OPEN状态成功
[monitor] 2021-04-13 17:11:27: 通知组(GRP1)的守护进程执行清理操作
[monitor] 2021-04-13 17:11:27: 清理守护进程(TEST01)请求成功
[monitor] 2021-04-13 17:11:27: 清理守护进程(TEST02)请求成功
[monitor] 2021-04-13 17:11:27: 实例TEST01切换成功

[root@ora62 yum.repos.d]# telnet 172.168.137.101 62141
Trying 172.168.137.101…
Connected to 172.168.137.101.
Escape character is ‘^]’.
Connection closed by foreign host.

`#================================================================================#
GROUP OGUID MON_CONFIRM MODE MPP_FLAG
DG1 6236 FALSE AUTO FALSE

<>
IP MAL_DW_PORT WTIME WTYPE WCTLSTAT WSTATUS INAME INST_OK N_EP N_OK ISTATUS IMODE DSC_STATUS RTYPE RSTAT
172.168.137.103 62142 2021-04-11 09:05:30 GLOBAL VALID OPEN DG2 OK 1 1 OPEN PRIMARY DSC_OPEN REALTIME VALID

EP INFO:
INST_PORT INST_OK INAME ISTATUS IMODE DSC_SEQNO DSC_CTL_NODE RTYPE RSTAT FSEQ FLSN CSEQ CLSN DW_STAT_FLAG
6236 OK DG2 OPEN PRIMARY 0 0 REALTIME VALID 6121 54442 6121 54442 NONE

<>
IP MAL_DW_PORT WTIME WTYPE WCTLSTAT WSTATUS INAME INST_OK N_EP N_OK ISTATUS IMODE DSC_STATUS RTYPE RSTAT
172.168.137.101 62141 2021-04-11 09:05:30 GLOBAL VALID OPEN DG1 OK 1 1 OPEN STANDBY DSC_OPEN REALTIME VALID

EP INFO:
INST_PORT INST_OK INAME ISTATUS IMODE DSC_SEQNO DSC_CTL_NODE RTYPE RSTAT FSEQ FLSN CSEQ CLSN DW_STAT_FLAG
6236 OK DG1 OPEN STANDBY 0 0 REALTIME VALID 6098 54442 6098 54442 NONE

DATABASE(DG1) APPLY INFO FROM (DG2), REDOS_PARALLEL_NUM (1):
DSC_SEQNO[0], (ASEQ, SSEQ, KSEQ)[6121, 6121, 6121], (ALSN, SLSN, KLSN)[54442, 54442, 54442], N_TSK[0], TSK_MEM_USE[0]
REDO_LSN_ARR: (54442)`

MON_CONFIRM:是否为确认监视器

WTIME:守护进程本地的当前时间,取自控制守护进程。

WTYPE:守护进程配置的守护类型,包括 LOCAL/GLOBAL 两种类型

WCTLSTAT:守护进程控制文件状态,包括 Valid/Split/Invalid 三种状态,对于配置为本地守护类型的实例,由于不需要有守护进程控制文件,该字段值为 NULL。

WSTATUS:守护进程状态,取自控制守护进程。

INAME:库名称,取自控制节点实例名

INST_OK:守护进程认定的节点实例状态,Ok 或 Error。

N_EP:库的节点个数

N_OK:此字段对 DMDSC 集群内的节点有效,表示 DMDSC 集群内 OK 节点个数

ISTATUS:数据库状态,包括 Startup/After Redo/Mount/Open/Suspend/Shutdown 这几种状态,由控制守护进程综合当前所有节点实例的状态得出

IMODE:数据库模式,包括 Unknown/Normal/Primary/Standby 这四种模式,由控制守护进程综合当前所有节点实例的模式得出

DSC_STATUS:此字段对单节点可忽略,只对 DMDSC 集群内的节点有意义,表示节点当前的 DMDSC 集群状态。

RTYPE:节点实例配置的归档类型,只统计 REALTIME/TIMELY 这两种归档类型,如果这两种归档都没有配置,则显示为 NONE

RSTAT : 此 字 段 对 备 库 有 效 , 表 示 主 库 到 备 库 的 归 档 状 态 , 可 能 为Valid/Invalid/Unknown,对于本地守护类型的备库,此字段为 NULL,对于主库本身,此字段值为 Valid。该字段值要从备库对应的主库实例上取,如果当前没有活动主库或者备库无法确认对应的主库,则该字段显示为 Unknown。

INST_PORT:节点实例的监听端口。

INST_OK:控制守护进程认定的节点实例状态,OK 或 ERROR。

INAME:节点实例名称。

ISTATUS:节点实例状态,包括 Startup/After Redo/Mount/Open/Suspend/

Shutdown 这几种状态。

IMODE:节点实例模式,包括 Normal/Primary/Standby 这三种模式。

DSC_STATUS:此字段对单节点可忽略,只对 DMDSC 集群内的节点有意义,表示节点当前的 DMDSC 集群状态。

DSC_SEQNO:此字段对单节点可忽略,只对 DMDSC 集群内的节点有意义,表示节点在

DMDSC 集群内的序号。

DSC_CONTROL_NODE:此字段对单节点可忽略,只对 DMDSC 集群内的节点有意义,表示 DMDSC 集群内控制节点的序号。

RTYPE:节点实例配置的归档类型,只统计 REALTIME/TIMELY 这两种归档类型,如果这两种归档都没有配置,则显示为 NONE。

RSTAT:此字段对备库控制节点有效,表示主库到备库控制节点的归档状态,可能为

Valid/Invalid/Unknown,对于本地守护类型的备库,此字段为 NULL,对于主库本身,此字段值为 Valid。该字段值要从备库对应的主库实例上取,如果当前没有活动主库或者备库无法确认对应的主库,则该字段显示为 Unknown。

FSEQ:节点实例已经写入联机日志的 RLOG_PKG 包序号。

FLSN:节点实例的文件 LSN,指已经写入联机日志文件的最大 LSN 值。

CSEQ:节点实例的系统当前 PKG_SEQNO,指当前数据库最新产生的 RLOG_PKG 包的序号。

CLSN:节点实例的系统当前 LSN,指当前数据库最新产生的 LSN 值。

DW_STAT_FLAG:节点当前的执行标记。

DSC_SEQNO:主库节点序号,如果主库是单节点,则序号为 0

FSEQ:节点实例已经写入联机日志的 RLOG_PKG 包序号。

FLSN:节点实例的文件 LSN,指已经写入联机日志文件的最大 LSN 值。

CSEQ:节点实例的系统当前 PKG_SEQNO,指当前数据库最新产生的 RLOG_PKG 包的

序号。

CLSN:节点实例的系统当前 LSN,指当前数据库最新产生的 LSN 值。

DW_STAT_FLAG:节点当前的执行标记。

如果是备库模式,show 命令还会显示备库控制节点当前的重演信息,重演信息的行数和产生日志的主库节点个数一致,可以查看备库对主库不同节点日志的重演情况。

DSC_SEQNO:主库节点序号,如果主库是单节点,则序号为 0。

SSEQ:备库可重演到的最大日志包序号。

SLSN:备库可重演到的最大 LSN,对应日志包序号为 STDBY_PKG_SEQNO。

KSEQ:非自动切换模式下,备库保持不重演的日志包序号。

KLSN:非自动切换模式下,备库保持不重演最大 LSN,对应的日志包序号为 KSEQ。

ASEQ:备库针对主库此节点已经重演到的日志包序号。

ALSN:备库针对主库此节点已经重演到的 LSN 值,对应的日志包序号为 ASEQ。

N_TSK:备库针对主库此节点的待重演任务个数。

TSK_MEM_USE:备库当前针对主库此节点的日志重演已经占用的内存大小(单位:字节)。

通过监视器执行 Stop Group 命令关闭数据守护系统,是最简单、安全的方式。命令

执行成功后,数据库实例正常关闭。但守护进程并没有真正退出,而是将状态切换为

Shutdown 状态。

Stop Group 命令内部流程如下:

\1. 通知守护进程切换为 Shutdown 状态

\2. 通知主库退出

\3. 通知其他备库退出

如果使用手动方式关闭数据守护系统,请严格按照以下顺序执行:

\1. 如果启动了确认监视器,先关闭确认监视器(防止自动接管)

\2. 关闭备库守护进程(防止重启实例)

\3. 关闭主库守护进程(防止重启实例)

\4. Shutdown 主库

\5. Shutdown 备库

如果是只关闭主库,并且不想引发备库自动接管,有以下两种方法:

方法一:

1.通过 Detach database 命令将所有备库分离

2.通过 Stop database 命令退出主库

方法二:严格按照以下顺序执行:

\1. 通过 Stop dmwatcher 命令关闭所有守护进程监控

\2. 手动正常退出主库

如果是只关闭备库,并且不想引发主库发送日志失败进入 Suspend 状态,请严格按照

以下顺序执行:

\1. 通过 Detach database 命令将备库分离出数据守护系统

\2. 正常退出备库(手动退出或者通过 Stop database 命令退出)

[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-1l2dm1Mk-1618133938558)(C:\Users\bj\AppData\Roaming\Typora\typora-user-images\image-20210411172328368.png)]

[root@ora61 ~]# chkconfig |grep Dm
DmAPService 0:off 1:off 2:on 3:on 4:on 5:on 6:off
DmMonitorServicedgmonitor 0:off 1:off 2:off 3:off 4:off 5:off 6:off
DmMonitorServicedxflmonitor 0:off 1:off 2:off 3:off 4:off 5:off 6:off
DmServiceDG 0:off 1:off 2:on 3:on 4:on 5:on 6:off
DmServiceDMSERVERDG 0:off 1:off 2:on 3:on 4:on 5:on 6:off
DmServicedanji 0:off 1:off 2:on 3:on 4:on 5:on 6:off
DmServicedg 0:off 1:off 2:on 3:on 4:on 5:on 6:off
DmServicedxfl 0:off 1:off 2:on 3:on 4:on 5:on 6:off
DmWatcherServicedgwatcher 0:off 1:off 2:on 3:on 4:on 5:on 6:off
DmWatcherServicedxflwatcher 0:off 1:off 2:on 3:on 4:on 5:on 6:off

[root@ora61 ~]# /etc/init.d/DmMonitorServicedgmonitor status
[root@ora61 ~]# /etc/init.d/DmMonitorServicedxflmonitor status
[root@ora61 ~]# /etc/init.d/DmWatcherServicedgwatcher stop
[root@ora61 ~]# /etc/init.d/DmWatcherServicedxflwatcher stop
[root@ora61 ~]# /etc/init.d/DmService
DmServicedanji DmServicedg DmServiceDG DmServiceDMSERVERDG DmServicedxfl
[root@ora61 ~]# /etc/init.d/DmServiceDMSERVERDG stop
[root@ora61 ~]# /etc/init.d/DmServicedxfl stop
[root@ora61 ~]# /etc/init.d/DmServicedg stop

归档类型比较

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
mkdir -p /dm8/dg-data
/home/dmdba/dmdbms/bin/dminit PATH=/dm8/dg-data DB_NAME=dg INSTANCE_NAME=dg1
/home/dmdba/dmdbms/bin/dminit PATH=/dm8/dg-data DB_NAME=dg INSTANCE_NAME=dg2

./dminit PATH=/dm8/dg-data PAGE_SIZE=32 EXTENT_SIZE=32 CHARSET=1 CASE_SENSITIVE=y DB_NAME=dg INSTANCE_NAME=dg2

/home/dmdba/dmdbms/script/root/dm_service_installer.sh -t dmserver -dm_ini /dm8/dg-data/dg/dm.ini -p DG
Move the service script file(/home/dmdba/dmdbms/bin/DmServiceDG to /etc/rc.d/init.d/DmServiceDG)
Finished to create the service (DmServiceDG)

自动切换把归档
类型改为REALTIME

本章节主要介绍在生产环境中(Linux 系统)规范化部署主备集群。

服务器硬件需求
按实际业务需求,选择合适的服务器,准备 3 台服务器,一台主库服务器,一台备库服务器,一台监视器服务器,服务器参数建议如下:

硬件 要求
物理内存 >=16 GB
交换区 Swap 空间>=物理内存
/tmp大小 > 1000 MB
网络 物理机器需要 4 个网卡,2 个 public 网卡做 band,2 个 private 网卡做 band
磁盘 根据实际应用系统需要挂载合适大小磁盘
时间服务器 按机房要求配置连接时间服务器
警告
守护进程配置自动切换时,必须在监视器服务器上配置确认监视器,并且保证网络高可用。

操作系统要求
操作系统版本安装
DM 数据库安装在 Linux 操作系统所需条件:glibc 2.3 以上,内核 2.6,预先安装 UnixODBC,系统性能监控等组件。

目录与存储规划
用途 目录路径 备注
数据库软件安装目录 /home/dmdba/dmdbms 可用空间>50 GB
实例安装目录 /dmdata 单独挂载性能最好的磁盘建议 SSD
归档日志存放目录 /dmarch 单独挂载磁盘
备份文件存放目录 /dmbak 单独挂载磁盘
用户与组
DM 数据库不应该使用 root 用户安装和维护。需要在安装之前为 DM 数据库创建一个专用的系统用户 (dmdba) 和用户组 (dinstall)。

执行以下命令,新建用户组 dinstall。

Copy
groupadd dinstall

执行以下命令,新建用户 dmdba。

Copy
useradd -g dinstall -m -d /home/dmdba -s /bin/bash dmdba

执行以下命令,修改 dmdba 用户密码。

Copy
passwd dmdba

输入密码并确认。

用户资源限制
执行以下命令,修改 dmdba 用户资源限制。

Copy
vim /etc/security/limits.conf

文件末尾添加如下内容:

Copy
dmdba soft core unlimited
dmdba hard core unlimited
dmdba soft nofile 65536
dmdba hard nofile 65536
dmdba soft nproc 65536
dmdba hard nproc 65536
dmdba soft stack 65536
dmdba hard stack 65536

用户环境变量
执行以下命令,修改 dmdba 用户环境变量。

vi /home/dmdba/.bash_profile

文件末尾添加如下内容:

export DM_HOME=/home/dmdba/dmdbms
export PATH=$PATH:$DM_HOME/bin
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:$DM_HOME/bin

防火墙设置
端口规划
搭建 2 节点主备集群,端口规划如下:(实际中可以按需要修改端口号)

主机名 public ip private ip 实例名 端口 用途
dmdsc1 192.168.56.11 10.0.0.11 dmrw1 5236 数据库实例 dmrw1 监听端口
dmdsc1 192.168.56.11 10.0.0.11 dmrw1 61141 MAL 系统监听 TCP 连接的端口
dmdsc1 192.168.56.11 10.0.0.11 dmrw1 52141 实例本地的守护进程监听 TCP 连接的端口
dmdsc1 192.168.56.11 10.0.0.11 dmrw1 33141 实例监听守护进程 TCP 连接的端口
dmdsc2 192.168.56.12 10.0.0.12 dmrw2 5236 数据库实例 dmrw2 监听端口
dmdsc2 192.168.56.12 10.0.0.12 dmrw2 61141 MAL 系统监听 TCP 连接的端口
dmdsc2 192.168.56.12 10.0.0.12 dmrw2 52141 实例本地的守护进程监听 TCP 连接的端口
dmdsc2 192.168.56.12 10.0.0.12 dmrw2 33141 实例监听守护进程 TCP 连接的端口
防火墙集群之间需开放以上所有端口,集群对客户端只需要开通数据库实例监听端口。

安装数据库
数据库软件安装详见单机规范化部署。

软件安装目录:/home/dmdba/dmdbms,实例初始化目录:/home/dmdba/dmdbms/dmrw,初始化脚本如下:

Copy
./dminit path=/home/dmdba/dmdbms db_name=dmrw page_size=32

注意
初始化的实例必须先启动一次,才能脱机备份。

主库脱机备份
确认主库 dmap 服务已启动,执行以下命令:

Copy
ps -ef|grep dmap

dmap服务

若未启动,则先启动 dmap 服务,dmdba 到安装目录的 bin 下执行以下命令:

Copy
./DmAPService start

关闭数据库后,使用 dmrman 工具脱机备份主库,dmdba 用户到安装目录的 bin 下执行以下命令:

Copy
./dmrman

执行 backup 全库。

Copy
backup database ‘/home/dmdba/dmdbms/dmrw/dm.ini’ backupset ‘/home/dmdba/bakfull’;

backup全库

备库还原
拷贝主库备份到备库合适目录,执行以下命令:

Copy
scp -r /home/dmdba/bakfull 192.168.56.12:/home/dmdba

scp备份文件

关闭数据库后,使用 dmrman 工具还原备库,dmdba 用户到安装目录的 bin 下执行以下命令:

Copy
./dmrman

执行 restore。

Copy
restore database ‘/home/dmdba/dmdbms/dmrw/dm.ini’ from backupset ‘/home/dmdba/bakfull’;

scp备份文件

执行 recover。

Copy
recover database ‘/home/dmdba/dmdbms/dmrw/dm.ini’ from backupset ‘/home/dmdba/bakfull’;

scp备份文件

执行 recover update db_magic。

Copy
recover database ‘/home/dmdba/dmdbms/dmrw/dm.ini’ update db_magic;

scp备份文件

配置实例的配置文件 dm.ini
修改实例的 dm.ini 文件参数,执行以下命令:

Copy
vi /home/dmdba/dmdbms/dmrw/dm.ini

主库修改以下参数值:

Copy
INSTANCE_NAME = dmrw1
MAL_INI = 1
ARCH_INI = 1
ALTER_MODE_STATUS = 0
ENABLE_OFFLINE_TS = 2

备库修改以下参数值:

Copy
INSTANCE_NAME = dmrw2
MAL_INI = 1
ARCH_INI = 1
ALTER_MODE_STATUS = 0
ENABLE_OFFLINE_TS = 2

配置归档配置文件 dmarch.ini
在实例目录下新建文件 dmarch.ini,执行以下命令:

Copy
vi /home/dmdba/dmdbms/dmrw/dmarch.ini

主库添加以下内容:

Copy
[ARCHIVE_REALTIME]
ARCH_TYPE = REALTIME #实时归档类型
ARCH_DEST = dmrw2 #实时归档目标实例名(主库侧填写备库实例名)
[ARCHIVE_LOCAL1]
ARCH_TYPE = LOCAL #本地归档类型
ARCH_DEST = /home/dmdba/dmdbms/arch #本地归档文件存放路径
ARCH_FILE_SIZE = 128 #单位 Mb,本地单个归档文件最大值
ARCH_SPACE_LIMIT = 10240 #单位 Mb,0 表示无限制,范围 1024~4294967294M

备库添加以下内容:

Copy
[ARCHIVE_REALTIME]
ARCH_TYPE = REALTIME #实时归档类型
ARCH_DEST = dmrw1 #实时归档目标实例名(备库侧填写主库实例名)
[ARCHIVE_LOCAL1]
ARCH_TYPE = LOCAL #本地归档类型
ARCH_DEST = /home/dmdba/dmdbms/arch #本地归档文件存放路径
ARCH_FILE_SIZE = 128 #单位 Mb,本地单个归档文件最大值
ARCH_SPACE_LIMIT = 10240 #单位 Mb,0 表示无限制,范围 1024~4294967294M

配置MAL系统配置文件 dmmal.ini
在实例目录下新建文件 dmmal.ini,执行以下命令:

Copy
vi /home/dmdba/dmdbms/dmrw/dmmal.ini

主备库文件内容要相同。

Copy
MAL_CHECK_INTERVAL = 5 #MAL 链路检测时间间隔
MAL_CONN_FAIL_INTERVAL = 5 #判定 MAL 链路断开的时间
[MAL_INST1]
MAL_INST_NAME = dmrw1 #与 dm.ini 中的 INSTANCE_NAME 一致
MAL_HOST = 10.0.0.11 #MAL 系统监听 TCP 内部网络 IP
MAL_PORT = 61141 #MAL 系统监听 TCP 连接的端口
MAL_INST_HOST = 192.168.56.11 #实例的对外服务 IP 地址
MAL_INST_PORT = 5236 #与 dm.ini 中的 PORT_NUM 一致
MAL_DW_PORT = 52141 #实例对应的守护进程监听 TCP 端口
MAL_INST_DW_PORT = 33141
[MAL_INST2]
MAL_INST_NAME = dmrw2 #与 dm.ini 中的 INSTANCE_NAME 一致
MAL_HOST = 10.0.0.12 # MAL 系统监听 TCP 内部网络 IP
MAL_PORT = 61141 #MAL 系统监听 TCP 连接的端口
MAL_INST_HOST = 192.168.56.12 #实例的对外服务 IP 地址
MAL_INST_PORT = 5236 #与 dm.ini 中的 PORT_NUM 一致
MAL_DW_PORT = 52141 #实例对应的守护进程监听 TCP 端口
MAL_INST_DW_PORT = 33141

配置守护进程配置文件 dmwatcher.ini
在实例目录下新建文件 dmwatcher.ini,执行以下命令:

Copy
vi /home/dmdba/dmdbms/dmrw/dmwatcher.ini

主备库文件内容要相同。

Copy
[GRP_RW]
DW_TYPE = GLOBAL #全局守护类型
DW_MODE = AUTO #自动切换模式
DW_ERROR_TIME = 10 #远程守护进程故障认定时间
INST_RECOVER_TIME = 60 #主库守护进程启动恢复的间隔时间
INST_ERROR_TIME = 10 #本地实例故障认定时间
INST_OGUID = 453331 #守护系统唯一 OGUID 值
INST_INI = /home/dmdba/dmdbms/dmrw/dm.ini #dm.ini 配置文件路径
INST_AUTO_RESTART = 1 #打开实例的自动启动功能
INST_STARTUP_CMD = /home/dmdba/dmdbms/bin/dmserver #命令行方式启动

以 Mount 方式启动数据库实例
使用 dmdba 用户,到数据库安装目录的 bin 下执行(主备库都执行)。

Copy
./dmserver /home/dmdba/dmdbms/dmrw/dm.ini mount

在新的终端使用 disql 工具连接数据库,执行以下命令:

Copy
./disql SYSDBA/SYSDBA

主备库都修改 oguid,执行以下命令:

Copy
sp_set_oguid(453331);

主库修改数据库模式为 primary,执行以下命令:

Copy
alter database primary;

备库修改数据库模式为 standby,执行以下命令:

Copy
alter database standby;

启动守护进程
dmdba 用户下,到数据库安装目录的 bin 下执行(主备库都执行)。

Copy
./dmwatcher /home/dmdba/dmdbms/dmrw/dmwatcher.ini

守护进程启动后,会将 Mount 的实例 Open。

启动确认监视器
守护进程配置为自动切换时,必须配置确认监视器。在主备服务器以外的服务器上(需安装有 DM 数据库软件,且与主备心跳网络端口开放)。

新建确认监视器配置文件 dmmonitor.ini,执行以下命令:

Copy
vi /home/dmdba/dmdbms/dmmonitor.ini

添加以下内容:

Copy
MON_DW_CONFIRM = 1 #确认监视器模式
MON_LOG_PATH = /home/dmdba/dmdbms/log #监视器日志文件存放路径
MON_LOG_INTERVAL = 60 #每隔 60s 定时记录系统信息到日志文件
MON_LOG_FILE_SIZE = 32 #每个日志文件最大 32MB
MON_LOG_SPACE_LIMIT = 0 #不限定日志文件总占用空间
[GRP_RW]
MON_INST_OGUID = 453331 #组 GRP_RW 的唯一 OGUID 值
#以下配置为监视器到组 GRP_RW 的守护进程的连接信息,以“IP:PORT”的形式配置
#IP 对应 dmmal.ini 中的 MAL_HOST,PORT 对应 dmmal.ini 中的 MAL_DW_PORT
MON_DW_IP = 10.0.0.11:52141
MON_DW_IP = 10.0.0.12:52141

启动监视器,执行以下命令:

Copy
./dmmonitor /home/dmdba/dmdbms/dmmonitor.ini

启动后输入 show 命令查看集群状态。

show查看

注册服务
以上启动为前台方式启动,仅用户搭建过程中验证配置。配置没问题后需要将实例,守护进程和确认监视器注册为系统服务。使用 root 用户,到数据库安装目录的 script/root 下,执行。

注册守护进程服务(主备库都执行)。

Copy
./dm_service_installer.sh -t dmwatcher -p dmrw -watcher_ini /home/dmdba/dmdbms/dmrw/dmwatcher.ini

注册数据库实例服务(主备库都执行)。

Copy
./dm_service_installer.sh -t dmserver -p dmrw -dm_ini /home/dmdba/dmdbms/dmrw/dm.ini

注册监视器服务(只需在监视器服务器上执行),执行以下命令:

Copy
./dm_service_installer.sh -t dmmonitor -p confirm -monitor_ini /home/dmdba/dmdbms/dmmonitor.ini

以服务方式启动
启动数据库实例,执行以下命令:

Copy
systemctl start DmServicedmrw

启动守护进程,执行以下命令:

Copy
systemctl start DmWatcherServicedmrw

启动监视器,执行以下命令:

Copy
systemctl start DmMonitorServiceconfirm

验证主备集群同步状态
监视器查看读写分离集群状态
集群任意节点,配置普通监视器配置文件 dmmonitor.ini,执行以下命令:

Copy
vi /home/dmdba/dmmonitor.ini

添加以下内容:

Copy
MON_DW_Confirm = 0 #普通监视器模式
MON_LOG_PATH = /home/dmdba/dmdbms/log #监视器日志文件存放路径
MON_LOG_INTERVAL = 60 #每隔 60s 定时记录系统信息到日志文件
MON_LOG_FILE_SIZE = 32 #每个日志文件最大 32 MB
MON_LOG_SPACE_LIMIT = 0 #不限定日志文件总占用空间
[GRP_RW]
MON_INST_OGUID = 453331 #组 GRP_RW 的唯一 OGUID 值
#以下配置为监视器到组 GRP_RW 的守护进程的连接信息,以“IP:PORT”的形式配置
#IP 对应 dmmal.ini 中的 MAL_HOST,PORT 对应 dmmal.ini 中的 MAL_DW_PORT
MON_DW_IP = 10.0.0.11:52141
MON_DW_IP = 10.0.0.12:52141

启动监视器,执行以下命令:

Copy
./dmmonitor /home/dmdba/dmmonitor.ini

输入 show 命令查看集群状态,执行以下命令:

show查看

其中守护进程状态 WSTATUS 为 OPEN,实例状态 ISTATUS 为 OPEN,归档类型 RTYPE 为 REALTIME,归档状态 RSTAT 为VALID。

disql 客户端验证
使用 disql 客户端登录主库,创建测试表,插入数据,执行以下命令:

Copy
./disql SYSDBA/SYSDBA@192.168.56.11:5236

SQL 提示符下执行以下命令:

Copy
create table test(id int);
insert into test values (1);
commit;

使用 disql 客户端登录备库,查询测试表验证,执行以下命令:

Copy
./disql SYSDBA/SYSDBA@192.168.56.12:5236

SQL 提示符下执行以下命令:

Copy
select * from test;

查询结果正确

参数优化
集群部署完成后,需要优化 dm.ini 参数,主备库都需要修改。参数值优化详见参数优化部分。

重启集群
主备集群重启有顺序要求:

关闭监视器:systemctl stop DmMonitorServiceconfirm
关闭主库守护进程:systemctl stop DmWatcherServicedmrw
关闭备库守护进程:systemctl stop DmWatcherServicedmrw
关闭主库实例:systemctl stop DmServicedmrw
关闭备库实例:systemctl stop DmServicedmrw
启动主库实例:systemctl start DmServicedmrw
启动备库实例:systemctl start DmServicedmrw
启动主库守护进程:systemctl start DmWatcherServicedmrw
启动备库守护进程:systemctl start DmWatcherServicedmrw
启动监视器:systemctl start DmMonitorServiceconfirm
定制备份策略
备份与单机部署相同,详见定制备份策略部分。

客户端连接集群
客户端主机上需要配置 dm_svc.conf 文件(未安装 DM 数据库的机器新建即可),文件路径:

32 位的 DM 安装在 Win32 操作平台下,此文件位于 %SystemRoot%\system32 目录;
64 位的 DM 安装在 Win64 操作平台下,此文件位于 %SystemRoot%\system32 目录;
32 位的 DM 安装在 Win64 操作平台下,此文件位于 %SystemRoot%\SysWOW64 目录;
在 Linux 平台下,此文件位于/etc 目录。
文件内容:

Copy

以#开头的行表示是注释

全局配置区

DMRW=(192.168.56.11:5236,192.168.56.12:5236)
TIME_ZONE=(+480) #表示+8:00 时区
LOGIN_ENCRYPT=(0)
DIRECT=(Y)

服务配置区

[DMRW]
TIME_ZONE=(+540) #表示+9:00 时区
LOGIN_MODE=(2)
SWITCH_TIME=(3)
SWITCH_INTERVAL=(10)

客户端程序连接数据库时,需要指定 ip 端口处替换为服务名即可,例如:

disql SYSDBA/SYSDBA@DMRW

注意
当修改了 dm_svc.conf 内容后,需要重启客户端程序,修改的配置才能生效。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值