提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档
文章目录
前言
DM 数据守护(Data Watch)是一种集成化的高可用、高性能数据库解决方案,是数
据库异地容灾的首选方案。通过部署 DM 数据守护,可以在硬件故障(如磁盘损坏)、自然
灾害(地震、火灾)等极端情况下,避免数据损坏、丢失,保障数据安全,并且可以快速恢
复数据库服务,满足用户不间断提供数据库服务的要求。
DM数据守护提供多种解决方案,可以配置成实时主备、MPP主备或读写分离集群
一、实时主备是什么?
实时主备由一个主库以及一个或者多个配置了实时(Realtime)归档的备库组成,其
主要目的是保障数据库可用性,提高数据安全性。实时主备系统中,主库提供完整的数据库
功能,备库提供只读服务。主库修改数据产生的Redo日志,通过实时归档机制,在写入联
机Redo日志文件之前发送到备库,实时备库通过重演Redo日志与主库保持数据同步。当主
库出现故障时,备库在将所有Redo日志重演结束后,就可以切换为主库对外提供数据库服
务。
数据守护系统结构图如下:
主要由主库、备库、Redo 日志、Redo 日志传输、Redo 日志重演、守护进程(dmwatcher)、监视器(dmmonitor)组成。
二、搭建环境说明
机器名 | IP | 初始状态 | 备注 |
---|---|---|---|
dmsh1 | 192.168.50.20/192.168.10.5 | 主库 | 内部通信:192.168.10.5/外部通信:192.168.50.20 |
dmsh2 | 192.168.50.21/192.168.10.6 | 备库 | 内部通信:192.168.10.6/外部通信:192.168.50.21 |
2.1 数据准备
在搭建之前,先准备两台机器,然后先备份下主库的数据,之后需要导入到备库上
备份主库数据
SQL> backup database backupset '/opt/dmdbms/bak';
backup database backupset '/opt/dmdbms/bak';
第1 行附近出现错误[-510]:系统处于MOUNT状态.
已用时间: 0.952(毫秒). 执行号:0.
SQL> alter database open;
操作已执行
已用时间: 983.540(毫秒). 执行号:0.
SQL> backup database backupset '/opt/dmdbms/bak';
操作已执行
已用时间: 00:03:15.214. 执行号:500.
SQL>
三、实时主备搭建
3.1 配置主库dm.ini
在dm.ini配置文件中找到如下内容,修改成对应的
#实例名,建议使用―组名_守护环境_序号‖的命名方式,总长度不能超过 16
INSTANCE_NAME = DMSERVER1
PORT_NUM = 5236 #数据库实例监听端口
DW_INACTIVE_INTERVAL = 60 #接收守护进程消息超时时间
ALTER_MODE_STATUS = 0 #不允许手工方式修改实例模式/状态/OGUID
ENABLE_OFFLINE_TS = 2 #不允许备库 OFFLINE 表空间
MAL_INI = 1 #打开 MAL 系统
ARCH_INI = 1 #打开归档配置
RLOG_SEND_APPLY_MON = 64 #统计最近 64 次的日志发送信息
3.2 配置主库dmmal.ini
[dmdba@dmsh1 DAMENG]$ cat dmmal.ini
MAL_CHECK_INTERVAL = 5 #MAL 链路检测时间间隔
MAL_CONN_FAIL_INTERVAL = 5 #判定 MAL 链路断开的时间
[MAL_INST1]
MAL_INST_NAME = DMSERVER1 #实例名,和 dm.ini 中的 INSTANCE_NAME 一致
MAL_HOST = 192.168.10.5 #MAL 系统监听 TCP 连接的 IP 地址
MAL_PORT = 12000 #MAL 系统监听 TCP 连接的端口
MAL_INST_HOST = 192.168.50.20 #实例的对外服务 IP 地址
MAL_INST_PORT = 5236 #实例的对外服务端口,和 dm.ini 中的 PORT_NUM 一致
MAL_DW_PORT = 12001 #实例本地的守护进程监听 TCP 连接的端口
MAL_INST_DW_PORT = 12002 #实例监听守护进程 TCP 连接的端口
[MAL_INST2]
MAL_INST_NAME = DMSERVER2
MAL_HOST = 192.168.10.6
MAL_PORT = 13000
MAL_INST_HOST = 192.168.50.21
MAL_INST_PORT = 5236
MAL_DW_PORT = 13001
MAL_INST_DW_PORT = 13002
3.3 配置主库dmarch.ini
[root@dmsh1 DAMENG]# cat dmarch.ini
ARCH_WAIT_APPLY = 0 #模式 0为高性能 1为事务一致性
[ARCHIVE_LOCAL1]
ARCH_TYPE = LOCAL
ARCH_DEST = /opt/dmdbms/data/DAMENG/arch
ARCH_FILE_SIZE = 64
ARCH_SPACE_LIMIT = 10240
ARCH_FLUSH_BUF_SIZE = 0
ARCH_HANG_FLAG = 1
[ARCHIVE_REALTIME]
ARCH_TYPE = REALTIME #实时归档类型
ARCH_DEST = DMSERVER2 #实施归档目标实例名
3.3 配置主库dmwatcher.ini
[root@dmsh1 DAMENG]# cat dmwatcher.ini
[GRP1]
DW_TYPE = GLOBAL #全局守护类型
DW_MODE = AUTO #自动切换模式
DW_ERROR_TIME = 10 #远程守护进程故障认定时间
INST_RECOVER_TIME = 60 #主库守护进程启动恢复的间隔时间
INST_ERROR_TIME = 10 #本地实例故障认定时间
INST_OGUID = 453331 #守护系统唯一 OGUID 值
INST_INI = /opt/dmdbms/data/DAMENG/dm.ini #dm.ini 配置文件路径
INST_AUTO_RESTART = 1 #打开实例的自动启动功能
INST_STARTUP_CMD = /opt/dmdbms/bin/dmserver #命令行方式启动
RLOG_APPLY_THRESHOLD = 0 #指定备库重演日志的时间阈值,默认关闭
3.4 配置从库dm.ini
#实例名,建议使用―组名_守护环境_序号‖的命名方式,总长度不能超过 16
INSTANCE_NAME = DMSERVER2
PORT_NUM = 5236 #数据库实例监听端口
DW_INACTIVE_INTERVAL = 60 #接收守护进程消息超时时间
ALTER_MODE_STATUS = 0 #不允许手工方式修改实例模式/状态/OGUID
ENABLE_OFFLINE_TS = 2 #不允许备库 OFFLINE 表空间
MAL_INI = 1 #打开 MAL 系统
ARCH_INI = 1 #打开归档配置
RLOG_SEND_APPLY_MON = 64 #统计最近 64 次的日志发送信息
3.5 配置从库dmmal.ini
跟主库dmmal.ini保持一致
[dmdba@dmsh1 DAMENG]$ cat dmmal.ini
MAL_CHECK_INTERVAL = 5 #MAL 链路检测时间间隔
MAL_CONN_FAIL_INTERVAL = 5 #判定 MAL 链路断开的时间
[MAL_INST1]
MAL_INST_NAME = DMSERVER1 #实例名,和 dm.ini 中的 INSTANCE_NAME 一致
MAL_HOST = 192.168.10.5 #MAL 系统监听 TCP 连接的 IP 地址
MAL_PORT = 12000 #MAL 系统监听 TCP 连接的端口
MAL_INST_HOST = 192.168.50.20 #实例的对外服务 IP 地址
MAL_INST_PORT = 5236 #实例的对外服务端口,和 dm.ini 中的 PORT_NUM 一致
MAL_DW_PORT = 12001 #实例本地的守护进程监听 TCP 连接的端口
MAL_INST_DW_PORT = 12002 #实例监听守护进程 TCP 连接的端口
[MAL_INST2]
MAL_INST_NAME = DMSERVER2
MAL_HOST = 192.168.10.6
MAL_PORT = 13000
MAL_INST_HOST = 192.168.50.21
MAL_INST_PORT = 5236
MAL_DW_PORT = 13001
MAL_INST_DW_PORT = 13002
3.6 配置从库dmarch.ini
[root@dmsh1 DAMENG]# cat dmarch.ini
ARCH_WAIT_APPLY = 0 #模式 0为高性能 1为事务一致性
[ARCHIVE_LOCAL1]
ARCH_TYPE = LOCAL
ARCH_DEST = /opt/dmdbms/data/DAMENG/arch
ARCH_FILE_SIZE = 64
ARCH_SPACE_LIMIT = 10240
ARCH_FLUSH_BUF_SIZE = 0
ARCH_HANG_FLAG = 1
[ARCHIVE_REALTIME]
ARCH_TYPE = REALTIME #实时归档类型
ARCH_DEST = DMSERVER2 #实施归档目标实例名
3.7 配置从库dmwatcher.ini
与主库dmwatcher.ini保持一致
[root@dmsh1 DAMENG]# cat dmwatcher.ini
[GRP1]
DW_TYPE = GLOBAL #全局守护类型
DW_MODE = AUTO #自动切换模式
DW_ERROR_TIME = 10 #远程守护进程故障认定时间
INST_RECOVER_TIME = 60 #主库守护进程启动恢复的间隔时间
INST_ERROR_TIME = 10 #本地实例故障认定时间
INST_OGUID = 453331 #守护系统唯一 OGUID 值
INST_INI = /opt/dmdbms/data/DAMENG/dm.ini #dm.ini 配置文件路径
INST_AUTO_RESTART = 1 #打开实例的自动启动功能
INST_STARTUP_CMD = /opt/dmdbms/bin/dmserver #命令行方式启动
RLOG_APPLY_THRESHOLD = 0 #指定备库重演日志的时间阈值,默认关闭
3.8 从库导入数据
关闭从库机器,导入主库的全备数据
[root@dmsh1 dmdbms]# scp -r bak/ root@192.168.100.121:/opt/dmdbms/bak
root@192.168.100.121's password:
bak.bak 100% 2735MB 13.1MB/s 03:28
bak_1.bak 100% 272KB 1.1MB/s 00:00
bak.meta 100% 93KB 483.2KB/s 00:00
RMAN> restore database '/opt/dmdbms/data/DAMENG/dm.ini' from backupset '/opt/dmdbms/bak';
restore database '/opt/dmdbms/data/DAMENG/dm.ini' from backupset '/opt/dmdbms/bak';
file dm.key not found, use default license!
Normal of FAST
Normal of DEFAULT
Normal of RECYCLE
Normal of KEEP
Normal of ROLL
[Percent:100.00%][Speed:0.00M/s][Cost:00:02:09][Remaining:00:00:00]
restore successfully.
time used: 00:02:10.406
RMAN> recover database '/opt/dmdbms/data/DAMENG/dm.ini' with archivedir '/opt/dmdbms/data/DAMENG/arch'
recover database '/opt/dmdbms/data/DAMENG/dm.ini' with archivedir '/opt/dmdbms/data/DAMENG/arch'
Database mode = 0, oguid = 0
Normal of FAST
Normal of DEFAULT
Normal of RECYCLE
Normal of KEEP
Normal of ROLL
EP[0]'s cur_lsn[38625814], file_lsn[38625814]
[Percent:100.00%][Speed:7230.00PKG/s][Cost:00:00:01][Remaining:00:00:00]
recover successfully!
time used: 00:00:02.005
RMAN> recover database '/opt/dmdbms/data/DAMENG/dm.ini' update db_magic;
recover database '/opt/dmdbms/data/DAMENG/dm.ini' update db_magic;
Database mode = 0, oguid = 0
Normal of FAST
Normal of DEFAULT
Normal of RECYCLE
Normal of KEEP
Normal of ROLL
EP[0]'s cur_lsn[38628444], file_lsn[38628444]
recover successfully!
time used: 00:00:01.096
3.9 启动主库修改参数
注意:数据库除了初始化实例的时候是需要正常启动,其余的启动都需要以mount的状态启动
否则系统启动时会重构回滚表空间,生成 Redo 日志;启动后应用可能连接到数据库实例进行操作,破坏主
备库的数据一致性。
修改主库信息
SQL> sp_set_para_value(1,'ALTER_MODE_STATUS',1);
DMSQL 过程已成功完成
已用时间: 692.177(毫秒). 执行号:501.
SQL> alter database mount;
操作已执行
已用时间: 79.463(毫秒). 执行号:0.
SQL> sp_set_oguid(453331);
DMSQL 过程已成功完成
已用时间: 164.071(毫秒). 执行号:502.
SQL> alter database primary;
操作已执行
已用时间: 153.568(毫秒). 执行号:0.
SQL> sp_set_para_value(1,'ALTER_MODE_STATUS',0);
DMSQL 过程已成功完成
已用时间: 6.579(毫秒). 执行号:503.
3.10 启动从库修改参数
SQL> sp_set_para_value(1,'ALTER_MODE_STATUS',1);
DMSQL 过程已成功完成
已用时间: 249.506(毫秒). 执行号:0.
SQL> sp_set_oguid(453331);
DMSQL 过程已成功完成
已用时间: 4.128(毫秒). 执行号:1.
SQL> alter database standby;
操作已执行
已用时间: 22.066(毫秒). 执行号:0.
SQL> sp_set_para_value(1,'ALTER_MODE_STATUS',0);
DMSQL 过程已成功完成
已用时间: 5.396(毫秒). 执行号:2.
3.11 配置单实例监视器
[dmdba@dmsh1 bin]$ cat /opt/dmdbms/data/DAMENG/dmmonitor.ini
MON_DW_CONFIRM = 0 #确认监视器模式
MON_LOG_PATH = /opt/dmdbms/log #监视器日志文件存放路径
MON_LOG_INTERVAL = 60 #每隔 60s 定时记录系统信息到日志文件
MON_LOG_FILE_SIZE = 32 #每个日志文件最大 32M
MON_LOG_SPACE_LIMIT = 0 #不限定日志文件总占用空间
[GRP1]
MON_INST_OGUID = 453331 #组 GRP1 的唯一 OGUID 值
MON_DW_IP = 192.168.10.5:12001
MON_DW_IP = 192.168.10.6:13001
3.12 启动主备库的守护进程
主备库启动命令一致
[root@dmsh1 bin]# ./dmwatcher path=/opt/dmdbms/data/DAMENG/dmwatcher.ini
DMWATCHER[4.0] V8
DMWATCHER[4.0] IS READY
3.13 启动普通监视器查看运行情况
[dmdba@dmsh1 bin]$ ./dmmonitor path=/opt/dmdbms/data/DAMENG/dmmonitor.ini
[monitor] 2022-06-10 17:08:28: DMMONITOR[4.0] V8
[monitor] 2022-06-10 17:08:28: DMMONITOR[4.0] IS READY.
[monitor] 2022-06-10 17:08:28: 收到守护进程(DMSERVER1)消息
WTIME WSTATUS INST_OK INAME ISTATUS IMODE RSTAT N_OPEN FLSN CLSN
2022-06-10 17:08:28 OPEN OK DMSERVER1 OPEN PRIMARY VALID 2 37306 37307
[monitor] 2022-06-10 17:08:28: 收到守护进程(DMSERVER2)消息
WTIME WSTATUS INST_OK INAME ISTATUS IMODE RSTAT N_OPEN FLSN CLSN
2022-06-10 17:08:28 OPEN OK DMSERVER2 OPEN STANDBY VALID 2 37305 37305
通过show查看可以看到当前实时主备搭建成功
show
2022-06-10 17:08:55
#================================================================================#
GROUP OGUID MON_CONFIRM MODE MPP_FLAG
GRP1 453331 FALSE AUTO FALSE
<<DATABASE GLOBAL INFO:>>
DW_IP MAL_DW_PORT WTIME WTYPE WCTLSTAT WSTATUS INAME INST_OK N_EP N_OK ISTATUS IMODE DSC_STATUS RTYPE RSTAT
192.168.10.5 12001 2022-06-10 17:08:54 GLOBAL VALID OPEN DMSERVER1 OK 1 1 OPEN PRIMARY DSC_OPEN REALTIME VALID
EP INFO:
INST_IP INST_PORT INST_OK INAME ISTATUS IMODE DSC_SEQNO DSC_CTL_NODE RTYPE RSTAT FSEQ FLSN CSEQ CLSN DW_STAT_FLAG
192.168.50.20 5236 OK DMSERVER1 OPEN PRIMARY 0 0 REALTIME VALID 4680 37315 4680 37315 NONE
<<DATABASE GLOBAL INFO:>>
DW_IP MAL_DW_PORT WTIME WTYPE WCTLSTAT WSTATUS INAME INST_OK N_EP N_OK ISTATUS IMODE DSC_STATUS RTYPE RSTAT
192.168.10.6 13001 2022-06-10 17:08:54 GLOBAL VALID OPEN DMSERVER2 OK 1 1 OPEN STANDBY DSC_OPEN REALTIME VALID
EP INFO:
INST_IP INST_PORT INST_OK INAME ISTATUS IMODE DSC_SEQNO DSC_CTL_NODE RTYPE RSTAT FSEQ FLSN CSEQ CLSN DW_STAT_FLAG
192.168.50.21 5236 OK DMSERVER2 OPEN STANDBY 0 0 REALTIME VALID 4481 37314 4481 37314 NONE
DATABASE(DMSERVER2) APPLY INFO FROM (DMSERVER1), REDOS_PARALLEL_NUM (1):
DSC_SEQNO[0], (RSEQ, SSEQ, KSEQ)[4679, 4679, 4680], (RLSN, SLSN, KLSN)[37314, 37314, 37315], N_TSK[0], TSK_MEM_USE[512]
REDO_LSN_ARR: (37314)
#================================================================================#
总结
如果你还有其他问题,欢迎到达梦社区来提问~
社区地址:https://eco.dameng.com