操作系统版本 | CentOS7.6 |
数据库版本 | DM8_20240712 |
数据守护集群版本 | V4.0 |
目录
背景
近日在学习DM8数据守护与读写分离集群,看到技术手册中提到这样一句话:"DM数据守护系统,基于TCP/IP协议,支持在一台物理机器上搭建数据守护系统"。集群不应该搭建在两台以上的主机上吗?在一台主机上有什么意义呢?答案很明显:方便!搭建方便,使用也方便!很适合学习和测试使用。于是便尝试了一下这种搭建方式。
问题分析及解决思路
一台主机上运行集群,需要创建多个数据库,分别承担主库、备库的角色。DM8支持在一台主机上创建和运行多个数据库,只要配置不同的端口号就可以了。同样的道理,也可以安装多个守护进程,分别服务主库和备库。
1.安装前准备
1.1环境要求
本文档部署目的是为了学习,有很多参数设置的很小。例如LOG_SIZE,PAGE_SIZE等,请根据实际情况调整。按照本文档的参数配置,大概需要3G的磁盘空间,就可以搭建起来。
1.2集群规划
A 节点 | B 节点 | 备注 | |
角色 | 主库 | 备库 | |
业务 IP | 192.168.220.128 | 192.168.220.128 | |
心跳 IP | 127.0.0.1 | 127.0.0.1 | |
实例名 | GRP1_RT_01 | GRP1_RT_02 | |
数据库名 | DB01 | DB02 | DB_NAME |
实例端口 | 6236 | 7236 | |
MAL 端口 | 6336 | 7336 | MAL 系统监听 TCP 连接的端口 |
MAL_DW_PORT | 6436 | 7436 | |
MAL_INST_DW_PORT | 6536 | 7536 | 实例监听守护进程 TCP 连接的端口 |
OGUID | 66123 | 66123 | |
守护组 | GRP1 | GRP1 | |
安装目录 | /dm8/dmdbms | /dm8/dmdbms | |
实例目录 | /dm8/data/ | /dm8/data/ | |
归档上限 | 51200 | 51200 |
注意:在本例中,DB_NAME一定要自定义,且2个节点名称不能相同。
1.3集群类型
达梦主备集群可以配置为实时主备、即使主备、同步备库、异步备库,本文配置的是实时主备。
2.集群搭建
2.1配置A节点
2.1.1 初始化实例并备份数据
初始化实例
/dm8/dmdbms/bin/dminit PATH=/dm8/data/ DB_NAME=DB01 INSTANCE_NAME=GRP1_RT_01 PAGE_SIZE=8 EXTENT_SIZE=16 LOG_SIZE=256 PORT_NUM=6236
启动服务
/dm8/dmdbms/bin/dmserver /dm8/data/DB01/dm.ini
开启归档
disql SYSDBA/SYSDBA@127.0.1.1:6236
SQL> ALTER DATABASE MOUNT;
SQL> ALTER DATABASE ARCHIVELOG;
SQL> ALTER DATABASE ADD ARCHIVELOG 'DEST=/dm8/data/DB01/arch, TYPE=LOCAL, FILE_SIZE=256, SPACE_LIMIT=51200';
SQL> ALTER DATABASE OPEN;
备份数据
SQL> BACKUP DATABASE BACKUPSET '/dm8/data/DB01/bak/FULL_BACKUP_20240820';
修改 dm.ini
SQL> SP_SET_PARA_VALUE (2,'DW_INACTIVE_INTERVAL',60);
SQL> SP_SET_PARA_VALUE (2,'ALTER_MODE_STATUS',0);
SQL> SP_SET_PARA_VALUE (2,'ENABLE_OFFLINE_TS',2);
SQL> SP_SET_PARA_VALUE (2,'MAL_INI',1);
SQL> SP_SET_PARA_VALUE (2,'RLOG_SEND_APPLY_MON',64);
关闭前台实例服务
2.1.2 修改 dmarch.ini
[dmdba@~]$ vi /dm8/data/DB01/dmarch.ini
ARCH_WAIT_APPLY = 0 #0:高性能 1:事务一致
[ARCHIVE_LOCAL]
ARCH_TYPE = LOCAL #本地归档类型
ARCH_DEST = /dm8/data/DB01/arch/ #本地归档存放路径
ARCH_FILE_SIZE = 64 #单个归档大小,单位 MB
ARCH_SPACE_LIMIT = 51200 #归档上限,单位 MB
[ARCHIVE_REALTIME1]
ARCH_TYPE = REALTIME #实时归档类型
ARCH_DEST = GRP1_RT_02 #实时归档目标实例名
2.1.3 创建 dmmal.ini
[dmdba@~]$ vi /dm8/data/DB01/dmmal.ini
MAL_CHECK_INTERVAL = 10 #MAL 链路检测时间间隔
MAL_CONN_FAIL_INTERVAL = 10 #判定 MAL 链路断开的时间
MAL_TEMP_PATH = /dm8/data/DB01/malpath/ #临时文件目录:注意,搭建伪集群时,2个节点使用不同的目录
MAL_BUF_SIZE = 64 #单个 MAL 缓存大小,单位 MB
MAL_SYS_BUF_SIZE = 2048 #MAL 总大小限制,单位 MB
MAL_COMPRESS_LEVEL = 0 #MAL 消息压缩等级,0 表示不压缩
[MAL_INST1]
MAL_INST_NAME = GRP1_RT_01 #实例名,和 dm.ini 的 INSTANCE_NAME 一致
MAL_HOST = 127.0.0.1 #MAL 系统监听 TCP 连接的 IP 地址
MAL_PORT = 6336 #MAL 系统监听 TCP 连接的端口
MAL_INST_HOST = 192.168.220.128 #实例的对外服务 IP 地址
MAL_INST_PORT = 6236 #实例对外服务端口,和 dm.ini 的 PORT_NUM 一致(实例的)
MAL_DW_PORT = 6436 #实例对应的守护进程监听 TCP 连接的端口(守护进程的)
MAL_INST_DW_PORT = 6536 #实例监听守护进程 TCP 连接的端口(实例的)
[MAL_INST2]
MAL_INST_NAME = GRP1_RT_02
MAL_HOST = 127.0.0.1
MAL_PORT = 7336
MAL_INST_HOST = 192.168.220.128
MAL_INST_PORT = 7236
MAL_DW_PORT = 7436
MAL_INST_DW_PORT = 7536
2.1.4 创建 dmwatcher.ini
vi /dm8/data/DB01/dmwatcher.ini
[GRP1]
DW_TYPE = GLOBAL #全局守护类型
DW_MODE = AUTO #MANUAL:故障手切 AUTO:故障自切
DW_ERROR_TIME = 20 #远程守护进程故障认定时间
INST_ERROR_TIME = 20 #本地实例故障认定时间
INST_RECOVER_TIME = 60 #主库守护进程启动恢复的间隔时间
INST_OGUID = 66123 #守护系统唯一 OGUID 值
INST_INI = /dm8/data/DB01/dm.ini #dm.ini 文件路径
INST_AUTO_RESTART = 1 #打开实例的自动启动功能
INST_STARTUP_CMD = /dm8/dmdbms/bin/dmserver #命令行方式启动
RLOG_SEND_THRESHOLD = 0 #指定主库发送日志到备库的时间阈值,默认关闭
RLOG_APPLY_THRESHOLD = 0 #指定备库重演日志的时间阈值,默认关闭
2.1.5 注册服务
[root@~]# /dm8/dmdbms/script/root/dm_service_installer.sh -t dmserver -p GRP1_RT_01 -dm_ini /dm8/data/DB01/dm.ini -m mount
[root@~]# /dm8/dmdbms/script/root/dm_service_installer.sh -t dmwatcher -p Watcher01 -watcher_ini /dm8/data/DB01/dmwatcher.ini
2.2 配置B节点
2.2.1 初始化实例
[dmdba@~]$ /dm8/dmdbms/bin/dminit PATH=/dm8/data/ DB_NAME=DB02 INSTANCE_NAME=GRP1_RT_02 PAGE_SIZE=8 EXTENT_SIZE=16 LOG_SIZE=256 PORT_NUM=7236
2.2.2 恢复数据
[dmdba@~]$ /dm8/dmdbms/bin/dmrman CTLSTMT="RESTORE DATABASE '/dm8/data/DB02/dm.ini' FROM BACKUPSET '/dm8/data/DB01/bak/FULL_BACKUP_20240820'"
[dmdba@~]$ /dm8/dmdbms/bin/dmrman CTLSTMT="RECOVER DATABASE '/dm8/data/DB02/dm.ini' FROM BACKUPSET '/dm8/data/DB01/bak/FULL_BACKUP_20240820'"
[dmdba@~]$ /dm8/dmdbms/bin/dmrman CTLSTMT="RECOVER DATABASE '/dm8/data/DB02/dm.ini' UPDATE DB_MAGIC"
2.2.3 替换 dmarch.ini
[dmdba@~]$ vi /dm8/data/DB02/dmarch.ini
ARCH_WAIT_APPLY = 0 #0:高性能 1:事务一致
[ARCHIVE_LOCAL]
ARCH_TYPE = LOCAL #本地归档类型
ARCH_DEST = /dm8/data/DB02/arch/ #本地归档存放路径
ARCH_FILE_SIZE = 256 #单个归档大小,单位 MB
ARCH_SPACE_LIMIT = 51200 #归档上限,单位 MB
[ARCHIVE_REALTIME1]
ARCH_TYPE = REALTIME #实时归档类型
ARCH_DEST = GRP1_RT_01 #实时归档目标实例名
2.2.4 配置 dm.ini、dmmal.ini 和 dmwatcher.ini
[dmdba@~]$ vi /dm8/data/DB02/dm.ini
INSTANCE_NAME = GRP1_RT_02
PORT_NUM = 7236 #数据库实例监听端口
DW_INACTIVE_INTERVAL = 60 #接收守护进程消息超时时间
ALTER_MODE_STATUS = 0 #不允许手工方式修改实例模式/状态/OGUID
ENABLE_OFFLINE_TS = 2 #不允许备库 OFFLINE 表空间
MAL_INI = 1 #打开 MAL 系统
ARCH_INI = 1 #打开归档配置
RLOG_SEND_APPLY_MON = 64 #统计最近 64 次的日志重演信息
本例中,备库dmmal.ini的MAL_TEMP_PATH参数与主库不同,其他参数配置完全一样
[dmdba@~]$ vi /dm8/data/DB02/dmmal.ini
MAL_CHECK_INTERVAL = 10 #MAL 链路检测时间间隔
MAL_CONN_FAIL_INTERVAL = 10 #判定 MAL 链路断开的时间
MAL_TEMP_PATH = /dm8/data/DB02/malpath/ #临时文件目录:注意,搭建伪集群时,2个节点使用不同的目录
MAL_BUF_SIZE = 64 #单个 MAL 缓存大小,单位 MB
MAL_SYS_BUF_SIZE = 2048 #MAL 总大小限制,单位 MB
MAL_COMPRESS_LEVEL = 0 #MAL 消息压缩等级,0 表示不压缩
[MAL_INST1]
MAL_INST_NAME = GRP1_RT_01 #实例名,和 dm.ini 的 INSTANCE_NAME 一致
MAL_HOST = 127.0.0.1 #MAL 系统监听 TCP 连接的 IP 地址
MAL_PORT = 6336 #MAL 系统监听 TCP 连接的端口
MAL_INST_HOST = 192.168.220.128 #实例的对外服务 IP 地址
MAL_INST_PORT = 6236 #实例对外服务端口,和 dm.ini 的 PORT_NUM 一致
MAL_DW_PORT = 6436 #实例对应的守护进程监听 TCP 连接的端口
MAL_INST_DW_PORT = 6536 #实例监听守护进程 TCP 连接的端口
[MAL_INST2]
MAL_INST_NAME = GRP1_RT_02
MAL_HOST = 127.0.0.1
MAL_PORT = 7336
MAL_INST_HOST = 192.168.220.128
MAL_INST_PORT = 7236
MAL_DW_PORT = 7436
MAL_INST_DW_PORT = 7536
本例中,备库dmwatcher.ini的INST_INI参数与主库不同,其他参数配置完全一样
vi /dm8/data/DB02/dmwatcher.ini
[GRP1]
DW_TYPE = GLOBAL #全局守护类型
DW_MODE = AUTO #MANUAL:故障手切 AUTO:故障自切
DW_ERROR_TIME = 20 #远程守护进程故障认定时间
INST_ERROR_TIME = 20 #本地实例故障认定时间
INST_RECOVER_TIME = 60 #主库守护进程启动恢复的间隔时间
INST_OGUID = 66123 #守护系统唯一 OGUID 值
INST_INI = /dm8/data/DB02/dm.ini #dm.ini 文件路径
INST_AUTO_RESTART = 1 #打开实例的自动启动功能
INST_STARTUP_CMD = /dm8/dmdbms/bin/dmserver #命令行方式启动
RLOG_SEND_THRESHOLD = 0 #指定主库发送日志到备库的时间阈值,默认关闭
RLOG_APPLY_THRESHOLD = 0 #指定备库重演日志的时间阈值,默认关闭
2.2.5 注册服务
[root@~]# /dm8/dmdbms/script/root/dm_service_installer.sh -t dmserver -p GRP1_RT_02 -dm_ini /dm8/data/DB02/dm.ini -m mount
[root@~]# /dm8/dmdbms/script/root/dm_service_installer.sh -t dmwatcher -p Watcher02 -watcher_ini /dm8/data/DB02/dmwatcher.ini
2.3 配置确认监视器
2.3.1 创建 dmmonitor.ini
[dmdba@~]$ vi /dm8/dmdbms/bin/dmmonitor.ini
MON_DW_CONFIRM = 1 #0:非确认(故障手切) 1:确认(故障自切)
MON_LOG_PATH = ../log #监视器日志文件存放路径
MON_LOG_INTERVAL = 60 #每隔 60s 定时记录系统信息到日志文件
MON_LOG_FILE_SIZE = 64 #单个日志大小,单位 MB
MON_LOG_SPACE_LIMIT = 2048 #日志上限,单位 MB
[GRP1]
MON_INST_OGUID = 66123 #组 GRP1 的唯一 OGUID 值
MON_DW_IP = 127.0.0.1:6436 #IP 对应 MAL_HOST,PORT 对应 MAL_DW_PORT
MON_DW_IP = 127.0.0.1:7436
2.3.2 注册服务
[root@~]# /dm8/dmdbms/script/root/dm_service_installer.sh -t dmmonitor -p Monitor -monitor_ini /dm8/dmdbms/bin/dmmonitor.ini
2.4 配置非确认监视器
在配置监视器时,一般配置好确认监视器后,建议再配置一个非确认监视器的配置文件,在主备发生切换时,可以通过前台的方式启动非确认监视器进行手动切换。非确认监视器是通过将监视器配置文件中 MON_DW_CONFIRM 参数值修改为 0 来实现,示例如下:
2.4.1 dmmonitor_manual.ini
[dmdba@~]$ vi /dm8/dmdbms/bin/dmmonitor_manual.ini
MON_DW_CONFIRM = 0 #0:非确认(故障手切) 1:确认(故障自切)
MON_LOG_PATH = ../log #监视器日志文件存放路径
MON_LOG_INTERVAL = 60 #每隔 60s 定时记录系统信息到日志文件
MON_LOG_FILE_SIZE = 64 #单个日志大小,单位 MB
MON_LOG_SPACE_LIMIT = 2048 #日志上限,单位 MB
[GRP1]
MON_INST_OGUID = 66123 #组 GRP1 的唯一 OGUID 值
MON_DW_IP = 127.0.0.1:6436 #IP 对应 MAL_HOST,PORT 对应 MAL_DW_PORT
MON_DW_IP = 127.0.0.1:7436
非确认监视器无需注册服务。
2.4.2 监视器使用
通过前台方式启动非确认监视器。
/dm8/dmdbms/bin/dmmonitor /dm8/dmdbms/bin/dmmonitor_manual.ini
2.5 启动服务及查看信息
2.5.1 启动数据库并修改参数
##A节点
[dmdba@~]$ /dm8/dmdbms/bin/DmServiceGRP1_RT_01 start
[dmdba@~]$ /dm8/dmdbms/bin/disql SYSDBA/SYSDBA@192.168.220.128:6236
SQL>SP_SET_PARA_VALUE(1, 'ALTER_MODE_STATUS', 1);
SQL> SP_SET_OGUID(66123);
SQL> ALTER DATABASE PRIMARY;
SQL>SP_SET_PARA_VALUE(1, 'ALTER_MODE_STATUS', 0);
##B节点
[dmdba@~]$ /dm8/dmdbms/bin/DmServiceGRP1_RT_02 start
[dmdba@~]$ /dm8/dmdbms/bin/disql SYSDBA/SYSDBA@192.168.220.128:7236
SQL>SP_SET_PARA_VALUE(1, 'ALTER_MODE_STATUS', 1);
SQL> SP_SET_OGUID(66123);
SQL> ALTER DATABASE STANDBY;
SQL>SP_SET_PARA_VALUE(1, 'ALTER_MODE_STATUS', 0);
select status$ from v$instance;
2.5.2 启动守护进程
##A/B节点
[dmdba@~]$ /dm8/dmdbms/bin/DmWatcherServiceWatcher01 start
[dmdba@~]$ /dm8/dmdbms/bin/DmWatcherServiceWatcher02 start
2.5.3 启动确认监视器
##后台启动
[dmdba@~]$ /dm8/dmdbms/bin/DmMonitorServiceMonitor start
##前台启动
[dmdba@~]$ /dm8/dmdbms/bin/dmmonitor /dm8/dmdbms/bin/dmmonitor.ini
2.5.4 启动非确认监视器
##通过前台方式启动非确认监视器。
/dm8/dmdbms/bin/dmmonitor /dm8/dmdbms/bin/dmmonitor_manual.ini
2.6 启停集群
##守护进程启动
##A/B 节点
[dmdba@~]$ /dm8/dmdbms/bin/DmWatcherServiceWatcher01 start
[dmdba@~]$ /dm8/dmdbms/bin/DmWatcherServiceWatcher02 start
##守护进程停止
##A/B节点
[dmdba@~]$ /dm8/dmdbms/bin/DmWatcherServiceWatcher01 stop
[dmdba@~]$ /dm8/dmdbms/bin/DmWatcherServiceWatcher02 stop
##A节点
[dmdba@~]$ /dm8/dmdbms/bin/DmServiceGRP1_RT_01 stop
##B节点
[dmdba@~]$ /dm8/dmdbms/bin/DmServiceGRP1_RT_02 stop
3.测试
3.1 数据同步测试
测试方案:在主库创建新表TB_TEST,插入数据,登录备库查询TB_TEST.
主库插入数据
/dm8/dmdbms/bin/disql SYSDBA/SYSDBA@192.168.220.128:6236
SQL> create table TB_TEST(C1 INT);
SQL> INSERT INTO TB_TEST VALUES(1);
SQL> INSERT INTO TB_TEST VALUES(2);
SQL> INSERT INTO TB_TEST VALUES(3);
SQL> COMMIT;
备库查询数据
/dm8/dmdbms/bin/disql SYSDBA/SYSDBA@192.168.220.128:7236
SQL> SELECT * FROM TB_TEST;
数据同步成功!
3.2 手动切换主备集群
登录非确认监视器
/dm8/dmdbms/bin/dmmonitor dmmonitor_manual.ini
login
输入命令"choose switchover 组名"查看可切换为主机的实例列表
执行命令进行切换
switchover GRP1.GRP1_RT_02
恢复原主机位置
choose switchover GRP1
switchover GRP1.GRP1_RT_01
3.3 制造主库故障,测试备库自动接管
停掉主库守护进程,模拟主库故障
DmServiceGRP1_RT_01 stop
检测到故障,备库切换为主库
3.4 恢复故障主机,加入集群
故障主机加入集群,角色是STANDBY
恢复原主机位置
switchover GRP1.GRP1_RT_01
恢复成功!
至此,已经成功在一台主机上搭建达梦主备集群,并完成若干测试,本文结束!