前言
本篇博客主要内容是关于达梦数据库的数据守护集群,也就是类似 MySQL 的 HA 集群来着。
1 服务器信息
1.1 演示环境
系统 | CPU | 内存 | 磁盘 | 网卡 | 数据库版本 | 服务器数量 |
---|---|---|---|---|---|---|
redhat 7.9 | 1C | 2G | 50G | 千兆 | DM8 | 2台 |
1.2 集群规划内容
数据守护集群两台部署服务器的实例名必须不同,因为达梦的集群会通过实例名去区分
- | A服务器 | B服务器 |
---|---|---|
心跳IP | 192.168.30.176 | 192.168.30.177 |
实例名 | GRP1_RT_01 | GRP1_RT_02 |
实例端口 | 5236 | 5236 |
MAL 端口 | 5336 | 5336 |
MAL 守护进程端口 | 5436 | 5436 |
守护进程端口 | 5536 | 5536 |
OGUID | 45331 | 45331 |
守护组 | GRP1 | GRP1 |
安装目录 | /home/dmdba/dmdbms/ | /home/dmdba/dmdbms/ |
实例目录 | /opt/dm/data/ | /opt/dm/data/ |
归档上限 | 51200 | 51200 |
1.3 软件安装
2 配置 A 服务器
2.1 实例初始化并备份数据
- 使用 dmdba 用户进行实例初始化。
## A 服务器实例配置化文件
cat > /home/dmdba/dmdbms/bin/grp1_dminit.ini << EOF
[GRP1_RT_01]
PATH = /opt/dm/data
PAGE_SIZE = 32
EXTENT_SIZE = 32
CASE_SENSITIVE = Y
CHARSET = 1
PORT_NUM = 5336
INSTANCE_NAME = GRP1_RT_01
LOG_SIZE = 2048
EOF
## 进行初始化
/home/dmdba/dmdbms/bin/dminit CONTROL=/home/dmdba/dmdbms/bin/grp1_dminit.ini
## 启动服务
/home/dmdba/dmdbms/bin/dmserver /opt/dm/data/DAMENG/dm.ini
- 需要另外开启一个会话进行启动数据库,开启归档
/home/dmdba/dmdbms/bin/disql SYSDBA/SYSDBA@192.168.30.176:5336
-- 开启归档
ALTER DATABASE MOUNT;
ALTER DATABASE ARCHIVELOG;
ALTER DATABASE ADD ARCHIVELOG 'DEST=/opt/dm/data/DAMENG/arch, TYPE=LOCAL, FILE_SIZE=1024, SPACE_LIMIT=51200';
ALTER DATABASE OPEN;
-- 备份数据
BACKUP DATABASE BACKUPSET '/opt/dm/data/DAMENG/bak/BACKUP_FILE';
-- 修改 dm.ini
SP_SET_PARA_VALUE (2,'PORT_NUM',5236);
SP_SET_PARA_VALUE (2,'DW_INACTIVE_INTERVAL',60);
SP_SET_PARA_VALUE (2,'ALTER_MODE_STATUS',0);
SP_SET_PARA_VALUE (2,'ENABLE_OFFLINE_TS',2);
SP_SET_PARA_VALUE (2,'MAL_INI',1);
SP_SET_PARA_VALUE (2,'RLOG_SEND_APPLY_MON',64);
2.1 修改 dmarch.ini
cat > /opt/dm/data/DAMENG/dmarch.ini << EOF
ARCH_WAIT_APPLY = 0 #0:高性能 1:事务一致
[ARCHIVE_LOCAL]
ARCH_TYPE = LOCAL #本地归档类型
ARCH_DEST = /opt/dm/data/DAMENG/arch/ #本地归档存放路径
ARCH_FILE_SIZE = 1024 #单个归档大小,单位 MB
ARCH_SPACE_LIMIT = 51200 #归档上限,单位 MB
[ARCHIVE_REALTIME1]
ARCH_TYPE = REALTIME #实时归档类型
ARCH_DEST = GRP1_RT_02 #实时归档目标实例名
EOF
2.2 新增 dmmal.ini
cat > /opt/dm/data/DAMENG/dmmal.ini << EOF
MAL_CHECK_INTERVAL = 10 #MAL 链路检测时间间隔
MAL_CONN_FAIL_INTERVAL = 10 #判定 MAL 链路断开的时间
MAL_TEMP_PATH = /opt/dm/data/malpath/ #临时文件目录
MAL_BUF_SIZE = 512 #单个 MAL 缓存大小,单位 MB
MAL_SYS_BUF_SIZE = 2048 #MAL 总大小限制,单位 MB
MAL_COMPRESS_LEVEL = 0 #MAL 消息压缩等级,0 表示不压缩
[MAL_INST1]
MAL_INST_NAME = GRP1_RT_01 #实例名,和 dm.ini 的 INSTANCE_NAME 一致
MAL_HOST = 192.168.30.176 #MAL 系统监听 TCP 连接的 IP 地址
MAL_PORT = 5336 #MAL 系统监听 TCP 连接的端口
MAL_INST_HOST = 172.16.1.1 #实例的对外服务 IP 地址
MAL_INST_PORT = 5236 #实例对外服务端口,和 dm.ini 的 PORT_NUM 一致
MAL_DW_PORT = 5436 #实例对应的守护进程监听 TCP 连接的端口
MAL_INST_DW_PORT = 5536 #实例监听守护进程 TCP 连接的端口
[MAL_INST2]
MAL_INST_NAME = GRP1_RT_02
MAL_HOST = 192.168.30.177
MAL_PORT = 5336
MAL_INST_HOST = 172.16.1.2
MAL_INST_PORT = 5236
MAL_DW_PORT = 5436
MAL_INST_DW_PORT = 5536
EOF
2.3 创建 dmwatcher.ini
cat > /opt/dm/data/DAMENG/dmwatcher.ini << EOF
[GRP1]
DW_TYPE = GLOBAL #全局守护类型
DW_MODE = AUTO #MANUAL:故障手切 AUTO:故障自切
DW_ERROR_TIME = 20 #远程守护进程故障认定时间
INST_ERROR_TIME = 20 #本地实例故障认定时间
INST_RECOVER_TIME = 60 #主库守护进程启动恢复的间隔时间
INST_OGUID = 45331 #守护系统唯一 OGUID 值
INST_INI = /opt/dm/data/DAMENG/dm.ini #dm.ini 文件路径
INST_AUTO_RESTART = 1 #打开实例的自动启动功能
INST_STARTUP_CMD = /opt/dm/bin/dmserver #命令行方式启动
RLOG_SEND_THRESHOLD = 0 #指定主库发送日志到备库的时间阈值,默认关闭
RLOG_APPLY_THRESHOLD = 0 #指定备库重演日志的时间阈值,默认关闭
EOF
2.4 拷贝备份文件
##拷贝备份文件到 B 机器(需要提前创建路径)
scp -r /opt/dm/data/DAMENG/bak/BACKUP_FILE dmdba@192.168.30.177:/opt/dm/data/DAMENG/bak
2.5 注册服务
/home/dmdba/dmdbms/script/root/dm_service_installer.sh -t dmserver -p GRP1_RT_01 -dm_ini /opt/dm/data/DAMENG/dm.ini -m mount
/home/dmdba/dmdbms/script/root/dm_service_installer.sh -t dmwatcher -p Watcher -watcher_ini /opt/dm/data/DAMENG/dmwatcher.ini
#卸载服务
#/home/dmdba/dmdbms/script/root/dm_service_uninstaller.sh -n DmServiceGRP1_RT_01
#/home/dmdba/dmdbms/script/root/dm_service_uninstaller.sh -n DmWatcherServiceWatcher
3 配置 B 服务器
3.1 实例初始化
- 使用 dmdba 用户进行实例初始化。
## A 服务器实例配置化文件
cat > /home/dmdba/dmdbms/bin/grp1_dminit.ini << EOF
[GRP1_RT_02]
PATH = /opt/dm/data
PAGE_SIZE = 32
EXTENT_SIZE = 32
CASE_SENSITIVE = Y
CHARSET = 1
PORT_NUM = 5336
INSTANCE_NAME = GRP1_RT_02
LOG_SIZE = 2048
EOF
## 进行初始化
/home/dmdba/dmdbms/bin/dminit CONTROL=/home/dmdba/dmdbms/bin/grp1_dminit.ini
3.2 恢复数据
## 恢复库
/home/dmdba/dmdbms/bin/dmrman CTLSTMT="RESTORE DATABASE '/opt/dm/data/DAMENG/dm.ini' FROM BACKUPSET '/opt/dm/data/DAMENG/bak/BACKUP_FILE'"
## 恢复库
/home/dmdba/dmdbms/bin/dmrman CTLSTMT="RECOVER DATABASE '/opt/dm/data/DAMENG/dm.ini' FROM BACKUPSET '/opt/dm/data/DAMENG/bak/BACKUP_FILE'"
## 更新库
/home/dmdba/dmdbms/bin/dmrman CTLSTMT="RECOVER DATABASE '/opt/dm/data/DAMENG/dm.ini' UPDATE DB_MAGIC"
3.3 替换 dmarch.ini
cat > /opt/dm/data/DAMENG/dmarch.ini << EOF
ARCH_WAIT_APPLY = 0 #0:高性能 1:事务一致
[ARCHIVE_LOCAL]
ARCH_TYPE = LOCAL #本地归档类型
ARCH_DEST = /opt/dm/data/DAMENG/arch/ #本地归档存放路径
ARCH_FILE_SIZE = 1024 #单个归档大小,单位 MB
ARCH_SPACE_LIMIT = 51200 #归档上限,单位 MB
[ARCHIVE_REALTIME1]
ARCH_TYPE = REALTIME #实时归档类型
ARCH_DEST = GRP1_RT_01 #实时归档目标实例名
EOF
3.4 配置 dm.ini、dmmal.ini 和 dmwatcher.ini
## 修订 dm.ini
cat >> /opt/dm/data/DAMENG/dm.ini << EOF
INSTANCE_NAME = GRP1_RT_02
PORT_NUM = 5236 #数据库实例监听端口
DW_INACTIVE_INTERVAL = 60 #接收守护进程消息超时时间
ALTER_MODE_STATUS = 0 #不允许手工方式修改实例模式/状态/OGUID
ENABLE_OFFLINE_TS = 2 #不允许备库 OFFLINE 表空间
MAL_INI = 1 #打开 MAL 系统
ARCH_INI = 1 #打开归档配置
RLOG_SEND_APPLY_MON = 64 #统计最近 64 次的日志重演信息
EOF
## 创建 dmmal.ini
cat > /opt/dm/data/DAMENG/dmmal.ini << EOF
MAL_CHECK_INTERVAL = 10 #MAL 链路检测时间间隔
MAL_CONN_FAIL_INTERVAL = 10 #判定 MAL 链路断开的时间
MAL_TEMP_PATH = /opt/dm/data/malpath/ #临时文件目录
MAL_BUF_SIZE = 512 #单个 MAL 缓存大小,单位 MB
MAL_SYS_BUF_SIZE = 2048 #MAL 总大小限制,单位 MB
MAL_COMPRESS_LEVEL = 0 #MAL 消息压缩等级,0 表示不压缩
[MAL_INST1]
MAL_INST_NAME = GRP1_RT_01 #实例名,和 dm.ini 的 INSTANCE_NAME 一致
MAL_HOST = 192.168.30.176 #MAL 系统监听 TCP 连接的 IP 地址
MAL_PORT = 5336 #MAL 系统监听 TCP 连接的端口
MAL_INST_HOST = 192.168.30.176 #实例的对外服务 IP 地址
MAL_INST_PORT = 5236 #实例对外服务端口,和 dm.ini 的 PORT_NUM 一致
MAL_DW_PORT = 5436 #实例对应的守护进程监听 TCP 连接的端口
MAL_INST_DW_PORT = 5536 #实例监听守护进程 TCP 连接的端口
[MAL_INST2]
MAL_INST_NAME = GRP1_RT_02
MAL_HOST = 192.168.30.177
MAL_PORT = 5336
MAL_INST_HOST = 192.168.30.177
MAL_INST_PORT = 5236
MAL_DW_PORT = 5436
MAL_INST_DW_PORT = 5536
EOF
## 创建 dmwatcher.ini
cat > /opt/dm/data/DAMENG/dmwatcher.ini << EOF
[GRP1]
DW_TYPE = GLOBAL #全局守护类型
DW_MODE = AUTO #MANUAL:故障手切 AUTO:故障自切
DW_ERROR_TIME = 20 #远程守护进程故障认定时间
INST_ERROR_TIME = 20 #本地实例故障认定时间
INST_RECOVER_TIME = 60 #主库守护进程启动恢复的间隔时间
INST_OGUID = 45331 #守护系统唯一 OGUID 值
INST_INI = /opt/dm/data/DAMENG/dm.ini #dm.ini 文件路径
INST_AUTO_RESTART = 1 #打开实例的自动启动功能
INST_STARTUP_CMD = /opt/dm/bin/dmserver #命令行方式启动
RLOG_SEND_THRESHOLD = 0 #指定主库发送日志到备库的时间阈值,默认关闭
RLOG_APPLY_THRESHOLD = 0 #指定备库重演日志的时间阈值,默认关闭
EOF
3.5 注册服务
/home/dmdba/dmdbms/script/root/dm_service_installer.sh -t dmserver -p GRP1_RT_02 -dm_ini /opt/dm/data/DAMENG/dm.ini -m mount
/home/dmdba/dmdbms/script/root/dm_service_installer.sh -t dmwatcher -p Watcher -watcher_ini /opt/dm/data/DAMENG/dmwatcher.ini
#卸载服务
#/home/dmdba/dmdbms/script/root/dm_service_uninstaller.sh -n DmServiceGRP1_RT_02
#/home/dmdba/dmdbms/script/root/dm_service_uninstaller.sh -n DmWatcherServiceWatcher
4 配置监视器
配置确认监视器,存放确认监视器配置文件,并注册后台自启服务。
4.1 创建 dmmonitor.ini
- A服务器为确认监控器,B服务器为非确认监控器。
## A 服务器上执行
cat > $DM_HOME/bin/dmmonitor.ini << EOF
MON_DW_CONFIRM = 1 #0:非确认(故障手切) 1:确认(故障自切)
MON_LOG_PATH = /opt/dm/dmlog/dmmonitor_log #监视器日志文件存放路径
MON_LOG_INTERVAL = 60 #每隔 60s 定时记录系统信息到日志文件
MON_LOG_FILE_SIZE = 512 #单个日志大小,单位 MB
MON_LOG_SPACE_LIMIT = 2048 #日志上限,单位 MB
[GRP1]
MON_INST_OGUID = 45331 #组 GRP1 的唯一 OGUID 值
MON_DW_IP = 192.168.30.176:5436 #IP 对应 MAL_HOST,PORT 对应 MAL_DW_PORT
MON_DW_IP = 192.168.30.177:5436
EOF
## 注册服务
source /home/dmdba/.bash_profile;$DM_HOME/script/root/dm_service_installer.sh -t dmmonitor -p Monitor -monitor_ini $DM_HOME/bin/dmmonitor.ini
- B服务器上执行 : 在主备发生切换时,可以通过前台的方式启动非确认监视器进行手动切换。
## B 服务器上执行,无须注册服务
cat > $DM_HOME/bin/dmmonitor.ini << EOF
MON_DW_CONFIRM = 0 #0:非确认(故障手切) 1:确认(故障自切)
MON_LOG_PATH = /opt/dm/dmlog/dmmonitor_log #监视器日志文件存放路径
MON_LOG_INTERVAL = 60 #每隔 60s 定时记录系统信息到日志文件
MON_LOG_FILE_SIZE = 512 #单个日志大小,单位 MB
MON_LOG_SPACE_LIMIT = 2048 #日志上限,单位 MB
[GRP1]
MON_INST_OGUID = 45331 #组 GRP1 的唯一 OGUID 值
MON_DW_IP = 192.168.30.176:5436 #IP 对应 MAL_HOST,PORT 对应 MAL_DW_PORT
MON_DW_IP = 192.168.30.177:5436
EOF
5 启动数据库及监控器
5.1 启动数据库并修改参数
## A 服务器
$DM_HOME/bin/DmServiceGRP1_RT_01 start
$DM_HOME/bin/disql SYSDBA/SYSDBA@192.168.30.176:5236
SP_SET_PARA_VALUE(1, 'ALTER_MODE_STATUS', 1);
SP_SET_OGUID(45331);
ALTER DATABASE PRIMARY;
SP_SET_PARA_VALUE(1, 'ALTER_MODE_STATUS', 0);
## B服务器
$DM_HOME/bin/DmServiceGRP1_RT_02 start
$DM_HOME/bin/disql SYSDBA/SYSDBA@192.168.30.177:5236
SP_SET_PARA_VALUE(1, 'ALTER_MODE_STATUS', 1);
SP_SET_OGUID(45331);
ALTER DATABASE STANDBY;
SP_SET_PARA_VALUE(1, 'ALTER_MODE_STATUS', 0);
5.2 启动守护进程
##A/B机器
$DM_HOME/bin/DmWatcherServiceWatcher start
5.3 启动监控器
## 后台启动 (A 服务器)
$DM_HOME/bin/dmmonitor start
## 前台启动(B服务器上启动)
$DM_HOME/bin/dmmonitor $DM_HOME/bin/dmmonitor.ini
6 主从切换测试
6.1 主从状态
## 通过前台方式启动非确认监视器
$DM_HOME/bin/dmmonitor $DM_HOME/bin/dmmonitor.ini
## 查看集群状态
tip
- 由图可以判断 A 服务器为主节点,B 服务器为从节点
6.2 登录并查看符合切换的服务器
## 登录
login
## 输入命令"choose switchover 组名"查看可切换为主机的实例列表
choose switchover GRP1
6.3 主备切换
##执行命令"switchover GRP1.实例名"进行切换。
switchover GRP1.GRP1_RT_02
## 查看集群状态
tip
## 退出
exit
6.3 数据测试
-- B服务为主服务器,创建表并插入数据
-- 创建表 CITY
CREATE TABLE city
(
city_id CHAR(3) NOT NULL,
city_name VARCHAR(40) NULL,
region_id INT NULL
);
-- 插入数据
INSERT INTO city(city_id,city_name,region_id) VALUES('BJ','北京',1);
INSERT INTO city(city_id,city_name,region_id) VALUES('SJZ','石家庄',1);
INSERT INTO city(city_id,city_name,region_id) VALUES('SH','上海',2);
INSERT INTO city(city_id,city_name,region_id) VALUES('NJ','南京',2);
INSERT INTO city(city_id,city_name,region_id) VALUES('GZ','广州',3);
INSERT INTO city(city_id,city_name,region_id) VALUES('HK','海口',3);
INSERT INTO city(city_id,city_name,region_id) VALUES('WH','武汉',4);
INSERT INTO city(city_id,city_name,region_id) VALUES('CS','长沙',4);
INSERT INTO city(city_id,city_name,region_id) VALUES('SY','沈阳',5);
INSERT INTO city(city_id,city_name,region_id) VALUES('XA','西安',6);
INSERT INTO city(city_id,city_name,region_id) VALUES('CD','成都',7);
--查询数据
select * from city limit 3;
--A服务器可以查询的到,即备集群可查询
select * from city limit 3;
7 别名配置
7.1 单机配置
cat > /home/dmdba/dm_svc.conf << EOF
##以#开头的行表示是注释
##全局配置区
TIME_ZONE=(480)
LANGUAGE=(cn)
DM=(192.168.30.176:5336)
EOF
7.2 集群配置
cat > /home/dmdba/dm_svc.conf << EOF
##以#开头的行表示是注释#
##全局配置区
TIME_ZONE=(480)
LANGUAGE=(cn)
DMHA=(192.168.30.176:5336,192.168.30.177:5336)
##服务配置
[DMHA]
SWITCH_TIMES=(3)
SWITCH_INTERVAL=(100)
LOGIN_MODE=(1)
EOF
## 连接示例
$DM_HOME/bin/disql SYSDBA/SYSDBA@DM
至此对达梦数据库的数据守护集群已经部署完成,本篇博客到此结束!