为了提高 MPP 系统可靠性,克服由于单节点故障导致整个系统不能继续正常工作, DM在普通的 MPP 系统基础上,引入主备守护机制,将 MPP 节点作为主库节点,增加备库作为备份节点,必要时可切换为主库代替故障节点工作,提高系统的可靠性和可用性。
文章目录
一、环境说明
-
配置两个守护组,分别为GRP1和GRP2,主库名为EP01和EP02,
备库名为EP11和EP22
-
准备三台机器MPP_A,MPP_B和MPP_M用来交叉部署监视器。
-
三台机器都事先安装了DM,我的安装路径为 ‘/dm8’,执行程序保存在 ‘/dm8/bin’ 目录中,数据存放路径为 ‘/dm8/data/EP01’ 和 ‘/dm8/data/EP02’ 。
其对应关系为:
机器MPP_A | 机器MPP_B |
---|---|
主库EP01 | 备库EP11 |
备库EP22 | 主库EP02 |
1、配置环境说明
机器名 | IP地址 | 初始状态 | 操作系统 |
---|---|---|---|
MPP_A | 外网:192.168.175.171 内网:192.168.146.171 | 主库EP01 备库EP22 | CentOS-7-x86_64-DVD-2009 |
MPP_B | 外网:192.168.175.172 内网:192.168.146.172 | 主库EP02 备库EP11 | CentOS-7-x86_64-DVD-2009 |
MPP_M | 内网:192.168.146.173 | 确认监视器 | CentOS-7-x86_64-DVD-2009 |
2、主库端口规划
实例名 | PORT_NUM | MAL_INST_DW_PORT | MAL_HOST | MAL_PORT | MAL_DW_PORT | MPP实例序号 |
---|---|---|---|---|---|---|
EP01 | 5236 | 5243 | 192.168.146.171 | 5337 | 5253 | 0 |
EP02 | 5236 | 5243 | 192.168.146.172 | 5337 | 5253 | 1 |
3、备库端口规划
实例名 | PORT_NUM | MAL_INST_DW_PORT | MAL_HOST | MAL_PORT | MAL_DW_PORT | 对应主库 |
---|---|---|---|---|---|---|
EP11 | 5237 | 5244 | 192.168.146.172 | 5338 | 5254 | EP01 |
EP22 | 5237 | 5244 | 192.168.146.171 | 5338 | 5254 | EP02 |
4.守护进程规划
组名 | 实例名 | 所在机器 |
---|---|---|
GRP1 | EP01 | 192.168.146.171 |
GRP1 | EP11 | 192.168.146.172 |
GRP2 | EP02 | 192.168.146.172 |
GRP2 | EP22 | 192.168.146.171 |
二、数据准备
1、数据库正常关闭
! 在脱机备份还原之前要确保数据库能够正常启动关闭
1.1 后台启动关闭
- 方式一:
切换至root用户下,执行:
systemctl stop DmServiceEP01.service //关闭数据库后台
- 方式二:
进入DM安装目录的bin目录下,执行:
./DmServiceEP01 stop
1.2 前台正常关闭
进入DM安装目录的bin目录下,执行:
./dmserver /dm8/data/EP01/DAMENG/dm.ini
等待打印出SYSTEM IS READY,之后便可按Ctrl+C关闭数据库前台
进入下面备份之前,先啰嗦一下,备份还原的时候都切换至dmdba用户进行操作,便可省略后续的授权操作。
2、脱机备份还原
2.1、EP01脱机备份
进入DM安装目录的bin目录下,启动dmrman工具:
./dmrman //启动工具
backup database '/dm8/data/EP01/DAMENG/dm.ini' full backupset '/dm8/fullbak1'
2.2、EP11脱机还原
(1)备库拷贝主库备份文件
scp -r 192.168.175.171:/dm8/fullbak1 /dm8/
(2)还原备份文件
进入安装目录bin目录下,启动dmrman工具
./dmrman
restore database '/dm8/data/EP01/DAMENG/dm.ini' from backupset '/dm8/fullbak1' recover database '/dm8/data/EP01/DAMENG/dm.ini' from backupset '/dm8/fullbak1' recover database '/dm8/data/EP01/DAMENG/dm.ini' update db_magic
2.3、EP02脱机备份
进入DM安装目录的bin目录下,启动dmrman工具:
./dmrman //启动工具
backup database '/dm8/data/EP02/DAMENG/dm.ini' full backupset '/dm8/fullbak2'
2.4、EP22脱机还原
(1)备库拷贝主库备份文件
scp -r 192.168.175.172:/dm8/fullbak1 /dm8/
(2)还原备份文件
进入安装目录bin目录下,启动dmrman工具
./dmrman
restore database '/dm8/data/EP01/DAMENG/dm.ini' from backupset '/dm8/fullbak2' recover database '/dm8/data/EP01/DAMENG/dm.ini' from backupset '/dm8/fullbak2' recover database '/dm8/data/EP01/DAMENG/dm.ini' update db_magic
3、授予权限
如果备份还原是在dmdba用户下操作的话,那么可以忽略此步。
查看备份文件的权限:
ll /dm8/fullbak1 //守护进程组GRP1的备份文件权限查看 ll /dm8/fullbak2 //守护进程组GRP2的备份文件权限查看 注:是在备库中查看
若备份文件属dmdba用户,那么就直接跳过下面授权步骤
若备份文件不属dmdba用户,那么就执行授权步骤
//要切换至root用户下执行下面命令 //守护组GRP1: chown dmdba:GRP1 -R /dm8/fullbak1 chmod -R 755 /dm8/fullbak1 //守护组GRP2 chown dmdba:GRP2 -R /dm8/fullbak2 chmod -R 755 /dm8/fullbak2
三、配置主库EP01
1、配置dm.ini
vi /dm8/data/EP01/DAMENG/dm.ini
注:主要修改前面四项即可
MAL_INI = 1 #打开 MAL 系统 ARCH_INI = 1 #打开 归档 ALTER_MODE_SATUS= 0 #不允许手工方式修改实例模式/状态/OGUID ENABLE_OFFLINE_TS= 2 #不允许备库 OFFLINE 表空间 RLOG_SEND_APPLY_MON = 64 #统计最近 64 次的日志发送信息 INSTANCE_NAME = EP01 #实例名 PORT_NUM = 5236 #数据库实例监听端口 DW_INACTIVE_INTERVAL = 60 #接收守护进程消息超时时间
2、配置dmmal.ini
-
配置 MAL 系统,各主备库的 dmmal.ini 配置必须完全一致,
-
MAL_HOST 使用内部网络 IP,
-
MAL_PORT 与 dm.ini 中 PORT_NUM 使用不同的端口值,
-
MAL_DW_PORT 是各实例对应的守护进程之间,以及守护进程和监视器之间的通信端口,
配置如下:
MAL_CHECK_INTERVAL = 5 #MAL 链路检测时间间隔 MAL_CONN_FAIL_INTERVAL = 5 #判定 MAL 链路断开的时间 [MAL_INST1] MAL_INST_NAME = EP01 #实例名,和 dm.ini 中的 INSTANCE_NAME 一致 MAL_HOST = 192.168.146.171 #MAL 系统监听 TCP 连接的 IP 地址 MAL_PORT = 5337 #MAL 系统监听 TCP 连接的端口 MAL_INST_HOST = 192.168.175.171 #实例的对外服务 IP 地址 MAL_INST_PORT = 5236 #实例的对外服务端口,和 dm.ini 中的 PORT_NUM 一致 MAL_DW_PORT = 5253 #实例本地的守护进程监听 TCP 连接的端口 MAL_INST_DW_PORT = 5243 #实例监听守护进程 TCP 连接的端口 [MAL_INST2] MAL_INST_NAME = EP02 #实例名,和 dm.ini 中的 INSTANCE_NAME 一致 MAL_HOST = 192.168.146.172 MAL_PORT = 5337 MAL_INST_HOST = 192.168.175.172 #实例的对外服务 IP 地址 MAL_INST_PORT = 5236 MAL_DW_PORT = 5253 #实例本地的守护进程监听 TCP 连接的端口 MAL_INST_DW_PORT = 5243 #实例监听守护进程 TCP 连接的端口 [MAL_INST3] MAL_INST_NAME = EP11 #实例名,和 dm.ini 中的 INSTANCE_NAME 一致 MAL_HOST = 192.168.146.172 #MAL 系统监听 TCP 连接的 IP 地址 MAL_PORT = 5338 #MAL 系统监听 TCP 连接的端口 MAL_INST_HOST = 192.168.175.172 #实例的对外服务 IP 地址 MAL_INST_PORT = 5237 #实例的对外服务端口,和 dm.ini 中的 PORT_NUM 一致 MAL_DW_PORT = 5254 #实例本地的守护进程监听 TCP 连接的端口 MAL_INST_DW_PORT = 5244 #实例监听守护进程 TCP 连接的端口 [MAL_INST4] MAL_INST_NAME = EP22 #实例名,和 dm.ini 中的 INSTANCE_NAME 一致 MAL_HOST = 192.168.146.171 #MAL 系统监听 TCP 连接的 IP 地址 MAL_PORT = 5338 #MAL 系统监听 TCP 连接的端口 MAL_INST_HOST = 192.168.175.171 #实例的对外服务 IP 地址 MAL_INST_PORT = 5237 #实例的对外服务端口,和 dm.ini 中的 PORT_NUM 一致 MAL_DW_PORT = 5254 #实例本地的守护进程监听 TCP 连接的端口 MAL_INST_DW_PORT = 5244 #实例监听守护进程 TCP 连接的端口
3、配置dmarch.ini
- 修改dmarch.ini,配置本地归档和实时归档。
- 除了本地归档之外,其他归档配置项中的ARCH_DEST表示实例是Primary模式时,需要同步归档数据的目标实例名。
- 当前实例EP01是主库,需要向MPP备库EP11同步数据,因此实时归档的ARCH_DEST分别配置为EP11。
vi /dm8/data/EP01/DAMENG/dmarch.ini
[ARCHIVE_TIMELY1] ARCH_TYPE = REALTIME #实时归档类型 ARCH_DEST = EP11 #实时归档目标实例名 [ARCHIVE_LOCAL1] ARCH_TYPE = LOCAL #本地归档类型 ARCH_DEST = /dm8/data/EP01/DAMENG/arch #本地归档文件存放路径 ARCH_FILE_SIZE = 128 #单位 Mb,本地单个归档文件最大值 ARCH_SPACE_LIMIT = 0 #单位 Mb, 0 表示无限制,范围 1024~4294967294M
4、配置dmmpp.ctl
(1)dmmpp.ctl 是二进制文件,由dmmpp.ini 文本通过dmctlcvt 工具转换而来,dmmpp.ini配置如下
[SERVICE_NAME1] MPP_SEQ_NO = 0 MPP_INST_NAME = EP01 [SERVICE_NAME2] MPP_SEQ_NO = 1 MPP_INST_NAME = EP02
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-MVFr1IWg-1661734778435)(D:\培训笔记\技术博客\数据守护集群搭建\MPP1\61.png)]
(2)转换命令执行:
进入安装目录的bin目录下,执行:
./dmctlcvt TYPE=2 SRC=/dm8/data/EP01/DAMENG/dmmpp.ini DEST=/dm8/data/EP01/DAMENG/dmmpp.ctl
5、启动主库EP01
以Mount方式启动主库:
./dmserver /dm8/data/EP01/DAMENG/dm.ini mount
注:一定要以 Mount 方式启动数据库实例, 否则系统启动时会重构回滚表空间,生成 Redo 日志; 并且, 启动后应用可能连接到数据库实例进行操作,破坏主备库的数据一致性。数据守护配置结束后,守护进程会自动 Open 数据库。
6、配置OGUID
启动命令行工具Disql,使用MPP类型为LOCAL方式,登录主库设置OGUID值。
登录
./disql SYSDBA/密码@192.168.175.171:5236#"{mpp_type=local}"
执行:
SQL>SP_SET_PARA_VALUE(1, 'ALTER_MODE_STATUS', 1); SQL>sp_set_oguid(45330); SQL>SP_SET_PARA_VALUE(1, 'ALTER_MODE_STATUS', 0);
注:系统通过 OGUID 值确定一个守护进程组,由用户保证 OGUID 值的唯一性,并确保数据守护系统中,数据库、守护进程和监视器配置相同的 OGUID 值。
7、设置主库模式
启动命令行工具Disql,使用MPP类型为LOCAL方式,登录主库修改数据库为Primary模式
SQL>alter database primary;
四、配置主库EP02
1、配置dm.ini
vi /dm8/data/EP02/DAMENG/dm.ini
注:主要修改前面四项即可
MAL_INI = 1 #打开 MAL 系统 ARCH_INI = 1 #打开 归档 ALTER_MODE_SATUS= 0 #不允许手工方式修改实例模式/状态/OGUID ENABLE_OFFLINE_TS= 2 #不允许备库 OFFLINE 表空间 RLOG_SEND_APPLY_MON = 64 #统计最近 64 次的日志发送信息 INSTANCE_NAME = EP02 #实例名 PORT_NUM = 5236 #数据库实例监听端口 DW_INACTIVE_INTERVAL = 60 #接收守护进程消息超时时间
2、配置dmmal.ini
-
配置 MAL 系统,各主备库的 dmmal.ini 配置必须完全一致,
-
MAL_HOST 使用内部网络 IP,
-
MAL_PORT 与 dm.ini 中 PORT_NUM 使用不同的端口值,
-
MAL_DW_PORT 是各实例对应的守护进程之间,以及守护进程和监视器之间的通信端口,
配置如下:
MAL_CHECK_INTERVAL = 5 #MAL 链路检测时间间隔 MAL_CONN_FAIL_INTERVAL = 5 #判定 MAL 链路断开的时间 [MAL_INST1] MAL_INST_NAME = EP01 #实例名,和 dm.ini 中的 INSTANCE_NAME 一致 MAL_HOST = 192.168.146.171 #MAL 系统监听 TCP 连接的 IP 地址 MAL_PORT = 5337 #MAL 系统监听 TCP 连接的端口 MAL_INST_HOST = 192.168.175.171 #实例的对外服务 IP 地址 MAL_INST_PORT = 5236 #实例的对外服务端口,和 dm.ini 中的 PORT_NUM 一致 MAL_DW_PORT = 5253 #实例本地的守护进程监听 TCP 连接的端口 MAL_INST_DW_PORT = 5243 #实例监听守护进程 TCP 连接的端口 [MAL_INST2] MAL_INST_NAME = EP02 #实例名,和 dm.ini 中的 INSTANCE_NAME 一致 MAL_HOST = 192.168.146.172 MAL_PORT = 5337 MAL_INST_HOST = 192.168.175.172 #实例的对外服务 IP 地址 MAL_INST_PORT = 5236 MAL_DW_PORT = 5253 #实例本地的守护进程监听 TCP 连接的端口 MAL_INST_DW_PORT = 5243 #实例监听守护进程 TCP 连接的端口 [MAL_INST3] MAL_INST_NAME = EP11 #实例名,和 dm.ini 中的 INSTANCE_NAME 一致 MAL_HOST = 192.168.146.172 #MAL 系统监听 TCP 连接的 IP 地址 MAL_PORT = 5338 #MAL 系统监听 TCP 连接的端口 MAL_INST_HOST = 192.168.175.172 #实例的对外服务 IP 地址 MAL_INST_PORT = 5237 #实例的对外服务端口,和 dm.ini 中的 PORT_NUM 一致 MAL_DW_PORT = 5254 #实例本地的守护进程监听 TCP 连接的端口 MAL_INST_DW_PORT = 5244 #实例监听守护进程 TCP 连接的端口 [MAL_INST4] MAL_INST_NAME = EP22 #实例名,和 dm.ini 中的 INSTANCE_NAME 一致 MAL_HOST = 192.168.146.171 #MAL 系统监听 TCP 连接的 IP 地址 MAL_PORT = 5338 #MAL 系统监听 TCP 连接的端口 MAL_INST_HOST = 192.168.175.171 #实例的对外服务 IP 地址 MAL_INST_PORT = 5237 #实例的对外服务端口,和 dm.ini 中的 PORT_NUM 一致 MAL_DW_PORT = 5254 #实例本地的守护进程监听 TCP 连接的端口 MAL_INST_DW_PORT = 5244 #实例监听守护进程 TCP 连接的端口
3、配置dmarch.ini
- 修改dmarch.ini,配置本地归档和实时归档。
- 除了本地归档之外,其他归档配置项中的ARCH_DEST表示实例是Primary模式时,需要同步归档数据的目标实例名。
- 当前实例EP02是主库,需要向MPP备库EP22同步数据,因此实时归档的ARCH_DEST分别配置为EP22。
vi /dm8/data/EP02/DAMENG/dmarch.ini
[ARCHIVE_TIMELY1] ARCH_TYPE = REALTIME #实时归档类型 ARCH_DEST = EP22 #实时归档目标实例名 [ARCHIVE_LOCAL1] ARCH_TYPE = LOCAL #本地归档类型 ARCH_DEST = /dm8/data/EP02/DAMENG/arch #本地归档文件存放路径 ARCH_FILE_SIZE = 128 #单位 Mb,本地单个归档文件最大值 ARCH_SPACE_LIMIT = 0 #单位 Mb, 0 表示无限制,范围 1024~4294967294M
4、配置dmmpp.ctl
(1)省时做法:
四个数据库实例的dmmpp.ctl是相同的,所以直接复制就行
远程复制(B机器从A机器中复制过来):
scp -r 192.168.175.171:/dm8/data/EP01/DAMENG/dmmpp.ctl /dm8/data/EP02/DAMENG/
本地复制(B机器实例EP11从B机器实例EP02复制过来,后面备库配置会详细说明)
z注:后面的库配置都可仿照这里进行即可。
(2)详细做法:
① dmmpp.ctl 是二进制文件,由dmmpp.ini 文本通过dmctlcvt 工具转换而来,dmmpp.ini配置如下
[SERVICE_NAME1] MPP_SEQ_NO = 0 MPP_INST_NAME = EP01 [SERVICE_NAME2] MPP_SEQ_NO = 1 MPP_INST_NAME = EP02
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-N2BC3NQA-1661734778436)(D:\培训笔记\技术博客\数据守护集群搭建\MPP1\61.png)]
② 转换命令执行:
进入安装目录的bin目录下,执行:
./dmctlcvt TYPE=2 SRC=/dm8/data/EP02/DAMENG/dmmpp.ini DEST=/dm8/data/EP02/DAMENG/dmmpp.ctl
5、启动主库EP02
以Mount方式启动主库:
./dmserver /dm8/data/EP02/DAMENG/dm.ini mount
注:一定要以 Mount 方式启动数据库实例, 否则系统启动时会重构回滚表空间,生成 Redo 日志; 并且, 启动后应用可能连接到数据库实例进行操作,破坏主备库的数据一致性。数据守护配置结束后,守护进程会自动 Open 数据库。
6、配置OGUID
启动命令行工具Disql,使用MPP类型为LOCAL方式,登录主库设置OGUID值。
登录
./disql SYSDBA/密码@192.168.175.171:5236#"{mpp_type=local}"
执行:
SQL>SP_SET_PARA_VALUE(1, 'ALTER_MODE_STATUS', 1); SQL>sp_set_oguid(45331); SQL>SP_SET_PARA_VALUE(1, 'ALTER_MODE_STATUS', 0);
注:系统通过 OGUID 值确定一个守护进程组,由用户保证 OGUID 值的唯一性,并确保数据守护系统中,数据库、守护进程和监视器配置相同的 OGUID 值。
7、设置主库模式
启动命令行工具Disql,使用MPP类型为LOCAL方式,登录主库修改数据库为Primary模式
SQL>alter database primary;
五、配置备库EP11
1、配置dm.ini
vi /dm8/data/EP01/DAMENG/dm.ini
注:主要修改前面四项即可
MAL_INI = 1 #打开 MAL 系统 ARCH_INI = 1 #打开 归档 ALTER_MODE_SATUS= 0 #不允许手工方式修改实例模式/状态/OGUID ENABLE_OFFLINE_TS= 2 #不允许备库 OFFLINE 表空间 RLOG_SEND_APPLY_MON = 64 #统计最近 64 次的日志发送信息 INSTANCE_NAME = EP01 #实例名 PORT_NUM = 5237 #数据库实例监听端口 DW_INACTIVE_INTERVAL = 60 #接收守护进程消息超时时间
2、配置dmmal.ini
-
配置 MAL 系统,各主备库的 dmmal.ini 配置必须完全一致,
-
MAL_HOST 使用内部网络 IP,
-
MAL_PORT 与 dm.ini 中 PORT_NUM 使用不同的端口值,
-
MAL_DW_PORT 是各实例对应的守护进程之间,以及守护进程和监视器之间的通信端口,
配置如下:
MAL_CHECK_INTERVAL = 5 #MAL 链路检测时间间隔 MAL_CONN_FAIL_INTERVAL = 5 #判定 MAL 链路断开的时间 [MAL_INST1] MAL_INST_NAME = EP01 #实例名,和 dm.ini 中的 INSTANCE_NAME 一致 MAL_HOST = 192.168.146.171 #MAL 系统监听 TCP 连接的 IP 地址 MAL_PORT = 5337 #MAL 系统监听 TCP 连接的端口 MAL_INST_HOST = 192.168.175.171 #实例的对外服务 IP 地址 MAL_INST_PORT = 5236 #实例的对外服务端口,和 dm.ini 中的 PORT_NUM 一致 MAL_DW_PORT = 5253 #实例本地的守护进程监听 TCP 连接的端口 MAL_INST_DW_PORT = 5243 #实例监听守护进程 TCP 连接的端口 [MAL_INST2] MAL_INST_NAME = EP02 #实例名,和 dm.ini 中的 INSTANCE_NAME 一致 MAL_HOST = 192.168.146.172 MAL_PORT = 5337 MAL_INST_HOST = 192.168.175.172 #实例的对外服务 IP 地址 MAL_INST_PORT = 5236 MAL_DW_PORT = 5253 #实例本地的守护进程监听 TCP 连接的端口 MAL_INST_DW_PORT = 5243 #实例监听守护进程 TCP 连接的端口 [MAL_INST3] MAL_INST_NAME = EP11 #实例名,和 dm.ini 中的 INSTANCE_NAME 一致 MAL_HOST = 192.168.146.172 #MAL 系统监听 TCP 连接的 IP 地址 MAL_PORT = 5338 #MAL 系统监听 TCP 连接的端口 MAL_INST_HOST = 192.168.175.172 #实例的对外服务 IP 地址 MAL_INST_PORT = 5237 #实例的对外服务端口,和 dm.ini 中的 PORT_NUM 一致 MAL_DW_PORT = 5254 #实例本地的守护进程监听 TCP 连接的端口 MAL_INST_DW_PORT = 5244 #实例监听守护进程 TCP 连接的端口 [MAL_INST4] MAL_INST_NAME = EP22 #实例名,和 dm.ini 中的 INSTANCE_NAME 一致 MAL_HOST = 192.168.146.171 #MAL 系统监听 TCP 连接的 IP 地址 MAL_PORT = 5338 #MAL 系统监听 TCP 连接的端口 MAL_INST_HOST = 192.168.175.171 #实例的对外服务 IP 地址 MAL_INST_PORT = 5237 #实例的对外服务端口,和 dm.ini 中的 PORT_NUM 一致 MAL_DW_PORT = 5254 #实例本地的守护进程监听 TCP 连接的端口 MAL_INST_DW_PORT = 5244 #实例监听守护进程 TCP 连接的端口
3、配置dmarch.ini
- 修改dmarch.ini文档,配置本地归档和实时归档。
- 除本地归档之外,其他配置项中的ARCH_DEST表示实例是Primary模式时,需要同步归档数据的目标实例名。
- 当前实例EP11是备库,守护系统配置完成后,可能在各种故障处理中,EP11切换为新的主库,(正常情况下,EP01会切换为新的备库),需要向EP01同步数据,因此实时归档的ARCH_DEST配置为EP01。
vi /dm8/data/EP01/DAMENG/dmarch.ini
[ARCHIVE_TIMELY1] ARCH_TYPE = REALTIME #实时归档类型 ARCH_DEST = EP01 #实时归档目标实例名 [ARCHIVE_LOCAL1] ARCH_TYPE = LOCAL #本地归档类型 ARCH_DEST = /dm8/data/EP01/DAMENG/arch #本地归档文件存放路径 ARCH_FILE_SIZE = 128 #单位 Mb,本地单个归档文件最大值 ARCH_SPACE_LIMIT = 0 #单位 Mb, 0 表示无限制,范围 1024~4294967294M
4、配置dmmpp.ctl
(1)省时做法:
四个数据库实例的dmmpp.ctl是相同的,所以直接复制就行。
本地复制(B机器实例EP11从B机器实例EP02复制过来):
cp /dm8/data/EP02/DAMENG/dmmpp.ctl /dm8/data/EP11/DAMENG/dmmpp.ctl
(2)详细做法:
① dmmpp.ctl 是二进制文件,由dmmpp.ini 文本通过dmctlcvt 工具转换而来,dmmpp.ini配置如下
[SERVICE_NAME1] MPP_SEQ_NO = 0 MPP_INST_NAME = EP01 [SERVICE_NAME2] MPP_SEQ_NO = 1 MPP_INST_NAME = EP02
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-L94M7mw9-1661734778436)(D:\培训笔记\技术博客\数据守护集群搭建\MPP1\61.png)]
② 转换命令执行:
进入安装目录的bin目录下,执行:
./dmctlcvt TYPE=2 SRC=/dm8/data/EP01/DAMENG/dmmpp.ini DEST=/dm8/data/EP01/DAMENG/dmmpp.ctl
5、启动备库EP11
以Mount方式启动主库:
./dmserver /dm8/data/EP01/DAMENG/dm.ini mount
注:一定要以 Mount 方式启动数据库实例, 否则系统启动时会重构回滚表空间,生成 Redo 日志; 并且, 启动后应用可能连接到数据库实例进行操作,破坏主备库的数据一致性。数据守护配置结束后,守护进程会自动 Open 数据库。
6、配置OGUID
启动命令行工具Disql,登录备库设置OGUID值。
登录
./disql SYSDBA/密码@192.168.175.172:5237
执行:
SQL>SP_SET_PARA_VALUE(1, 'ALTER_MODE_STATUS', 1); SQL>sp_set_oguid(45330); SQL>SP_SET_PARA_VALUE(1, 'ALTER_MODE_STATUS', 0);
注:系统通过 OGUID 值确定一个守护进程组,由用户保证 OGUID 值的唯一性,并确保数据守护系统中,数据库、守护进程和监视器配置相同的 OGUID 值。
7、设置主库模式
启动命令行工具Disql,使用MPP类型为LOCAL方式,登录主库修改数据库为Primary模式
SQL>alter database primary;
六、配置备库EP22
1、配置dm.ini
vi /dm8/data/EP02/DAMENG/dm.ini
注:主要修改前面四项即可
MAL_INI = 1 #打开 MAL 系统 ARCH_INI = 1 #打开 归档 ALTER_MODE_SATUS= 0 #不允许手工方式修改实例模式/状态/OGUID ENABLE_OFFLINE_TS= 2 #不允许备库 OFFLINE 表空间 RLOG_SEND_APPLY_MON = 64 #统计最近 64 次的日志发送信息 INSTANCE_NAME = EP02 #实例名 PORT_NUM = 5237 #数据库实例监听端口 DW_INACTIVE_INTERVAL = 60 #接收守护进程消息超时时间
2、配置dmmal.ini
-
配置 MAL 系统,各主备库的 dmmal.ini 配置必须完全一致,
-
MAL_HOST 使用内部网络 IP,
-
MAL_PORT 与 dm.ini 中 PORT_NUM 使用不同的端口值,
-
MAL_DW_PORT 是各实例对应的守护进程之间,以及守护进程和监视器之间的通信端口,
配置如下:
MAL_CHECK_INTERVAL = 5 #MAL 链路检测时间间隔 MAL_CONN_FAIL_INTERVAL = 5 #判定 MAL 链路断开的时间 [MAL_INST1] MAL_INST_NAME = EP01 #实例名,和 dm.ini 中的 INSTANCE_NAME 一致 MAL_HOST = 192.168.146.171 #MAL 系统监听 TCP 连接的 IP 地址 MAL_PORT = 5337 #MAL 系统监听 TCP 连接的端口 MAL_INST_HOST = 192.168.175.171 #实例的对外服务 IP 地址 MAL_INST_PORT = 5236 #实例的对外服务端口,和 dm.ini 中的 PORT_NUM 一致 MAL_DW_PORT = 5253 #实例本地的守护进程监听 TCP 连接的端口 MAL_INST_DW_PORT = 5243 #实例监听守护进程 TCP 连接的端口 [MAL_INST2] MAL_INST_NAME = EP02 #实例名,和 dm.ini 中的 INSTANCE_NAME 一致 MAL_HOST = 192.168.146.172 MAL_PORT = 5337 MAL_INST_HOST = 192.168.175.172 #实例的对外服务 IP 地址 MAL_INST_PORT = 5236 MAL_DW_PORT = 5253 #实例本地的守护进程监听 TCP 连接的端口 MAL_INST_DW_PORT = 5243 #实例监听守护进程 TCP 连接的端口 [MAL_INST3] MAL_INST_NAME = EP11 #实例名,和 dm.ini 中的 INSTANCE_NAME 一致 MAL_HOST = 192.168.146.172 #MAL 系统监听 TCP 连接的 IP 地址 MAL_PORT = 5338 #MAL 系统监听 TCP 连接的端口 MAL_INST_HOST = 192.168.175.172 #实例的对外服务 IP 地址 MAL_INST_PORT = 5237 #实例的对外服务端口,和 dm.ini 中的 PORT_NUM 一致 MAL_DW_PORT = 5254 #实例本地的守护进程监听 TCP 连接的端口 MAL_INST_DW_PORT = 5244 #实例监听守护进程 TCP 连接的端口 [MAL_INST4] MAL_INST_NAME = EP22 #实例名,和 dm.ini 中的 INSTANCE_NAME 一致 MAL_HOST = 192.168.146.171 #MAL 系统监听 TCP 连接的 IP 地址 MAL_PORT = 5338 #MAL 系统监听 TCP 连接的端口 MAL_INST_HOST = 192.168.175.171 #实例的对外服务 IP 地址 MAL_INST_PORT = 5237 #实例的对外服务端口,和 dm.ini 中的 PORT_NUM 一致 MAL_DW_PORT = 5254 #实例本地的守护进程监听 TCP 连接的端口 MAL_INST_DW_PORT = 5244 #实例监听守护进程 TCP 连接的端口
3、配置dmarch.ini
- 修改dmarch.ini文档,配置本地归档和实时归档。
- 除本地归档之外,其他配置项中的ARCH_DEST表示实例是Primary模式时,需要同步归档数据的目标实例名。
- 当前实例EP22是备库,守护系统配置完成后,可能在各种故障处理中,EP22切换为新的主库,(正常情况下,EP02会切换为新的备库),需要向EP02同步数据,因此实时归档的ARCH_DEST配置为EP02。
vi /dm8/data/EP02/DAMENG/dmarch.ini
[ARCHIVE_TIMELY1] ARCH_TYPE = REALTIME #实时归档类型 ARCH_DEST = EP02 #实时归档目标实例名 [ARCHIVE_LOCAL1] ARCH_TYPE = LOCAL #本地归档类型 ARCH_DEST = /dm8/data/EP02/DAMENG/arch #本地归档文件存放路径 ARCH_FILE_SIZE = 128 #单位 Mb,本地单个归档文件最大值 ARCH_SPACE_LIMIT = 0 #单位 Mb, 0 表示无限制,范围 1024~4294967294M
4、配置dmmpp.ctl
(1)省时做法:
四个数据库实例的dmmpp.ctl是相同的,所以直接复制就行。
本地复制(A机器实例EP22从A机器实例EP01复制过来):
cp /dm8/data/EP01/DAMENG/dmmpp.ctl /dm8/data/EP01/DAMENG/dmmpp.ctl
(2)详细做法:
① dmmpp.ctl 是二进制文件,由dmmpp.ini 文本通过dmctlcvt 工具转换而来,dmmpp.ini配置如下
[SERVICE_NAME1] MPP_SEQ_NO = 0 MPP_INST_NAME = EP01 [SERVICE_NAME2] MPP_SEQ_NO = 1 MPP_INST_NAME = EP02
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-zS22HlUC-1661734778437)(D:\培训笔记\技术博客\数据守护集群搭建\MPP1\61.png)]
② 转换命令执行:
进入安装目录的bin目录下,执行:
./dmctlcvt TYPE=2 SRC=/dm8/data/EP02/DAMENG/dmmpp.ini DEST=/dm8/data/EP02/DAMENG/dmmpp.ctl
5、启动备库EP11
以Mount方式启动主库:
./dmserver /dm8/data/EP02/DAMENG/dm.ini mount
注:一定要以 Mount 方式启动数据库实例, 否则系统启动时会重构回滚表空间,生成 Redo 日志; 并且, 启动后应用可能连接到数据库实例进行操作,破坏主备库的数据一致性。数据守护配置结束后,守护进程会自动 Open 数据库。
6、配置OGUID
启动命令行工具Disql,登录备库设置OGUID值。
登录
./disql SYSDBA/密码@192.168.175.171:5237
执行:
SQL>SP_SET_PARA_VALUE(1, 'ALTER_MODE_STATUS', 1); SQL>sp_set_oguid(45331); SQL>SP_SET_PARA_VALUE(1, 'ALTER_MODE_STATUS', 0);
注:系统通过 OGUID 值确定一个守护进程组,由用户保证 OGUID 值的唯一性,并确保数据守护系统中,数据库、守护进程和监视器配置相同的 OGUID 值。
7、设置主库模式
启动命令行工具Disql,登录主库修改数据库为Stnadby模式
SQL>SP_SET_PARA_VALUE(1, 'ALTER_MODE_STATUS', 1); SQL>ALTER DATABASE STANDBY; SQL>SP_SET_PARA_VALUE(1, 'ALTER_MODE_STATUS', 0);
七、配置dmwatcher.ini
1、组GRP1配置dmwatcher.ini
在A机器中配置,
vi /dm8/data/EP01/DAMENG/dmwatcher.ini
2、组GRP2配置dmwatcher.ini
在B机器中配置,
vi /dm8/data/EP02/DAMENG/dmwatcher.ini
八、配置确认监视器
vi /dm8/data/dmmonitor.ini
MON_DW_CONFIRM = 1 #确认监视器模式 MON_LOG_PATH =/dm8/data/log #监视器日志文件存放路径 MON_LOG_INTERVAL = 60 #每隔60s定时记录系统信息到日志文件 MON_LOG_FILE_SIZE = 32 #每个日志文件最大32M MON_LOG_SPACE_LIMIT = 0 #不限定日志文件总占用空间 [GRP1] MON_INST_OGUID = 45330 #组GRP1的唯一OGUID值 #以下配置为监视器到组GRP1的守护进程的连接信息,以―IP:PORT‖的形式配置 #IP对应dmmal.ini中的 MAL_HOST,PORT对应dmmal.ini中的 MAL_DW_PORT MON_DW_IP = 192.168.146.171:5253 MON_DW_IP = 192.168.146.172:5254 [GRP2] MON_INST_OGUID = 45331 #组GRP2的唯一OGUID值 #以下配置为监视器到组GRP2的守护进程的连接信息,以―IP:PORT‖的形式配置 #IP对应 dmmal.ini 中的MAL_HOST,PORT对应dmmal.ini中的MAL_DW_PORT MON_DW_IP = 192.168.146.172:5253 MON_DW_IP = 192.168.146.171:5254
九、启动主备守护进程
分别启动机器A、B上的守护进程,
./dmwatcher /dm8/data/EP01/DAMENG/dmwatcher.ini
./dmwatcher /dm8/data/EP02/DAMENG/dmwatcher.ini
守护进程启动后,进入 Startup 状态,此时实例都处于 Mount 状态。守护进程开始广播自身和其监控实例的状态信息,结合自身信息和远程守护进程的广播信息,守护进程将本地实例 Open,并切换为 Open 状态。
十、启动监视
启动监视器
./dmmonitor /dm8/data/dmmonitor.ini
至此 MPP 实时主备搭建完毕,在搭建步骤和各项配置都正确的情况下,在监视器上执行 show 命令,可以监控到所有实例都处于 Open 状态,所有守护进程也都处于 Open 状态,即为正常运行状态。