带主备集群的MPP搭建
环境说明
配置2个MPP节点,每个节点作为主库,与其备库组成一个守护组,因此需要配置两个守护组。
主库实例名GRP1_MPP_EP01、GRP1_MPP_EP02,端口5236,ip地址192.168.186.100、192.168.186.101。备库实例名GRP1_MPP_EP11、GRP2_MPP_EP22,端口5237,ip地址192.168.186.101、192.168.186.100。GRP1_MPP_EP01对应的MPP实例序号为0,对应备库为GRP1_MPP_EP11;GRP1_MPP_EP02对应的实例序号为1,对应备库为GRP2_MPP_EP22。
数据准备
初始化四个库的实例
机器1初始化主库1
./dminit PATH=/dm/data PAGE_SIZE=16 CASE_SENSITIVE=y CHARSET=0 DB_NAME=DAMENG1 INSTANCE_NAME=GRP1_MPP_EP01 PORT_NUM=5236
机器2初始化主库2
./dminit PATH=/dm/data PAGE_SIZE=16 CASE_SENSITIVE=y CHARSET=0 DB_NAME=DAMENG2 INSTANCE_NAME=GRP2_MPP_EP02 PORT_NUM=5236
机器2初始化主库1的备库
./dminit PATH=/dm/data PAGE_SIZE=16 CASE_SENSITIVE=y CHARSET=0 DB_NAME=DAMENG11 INSTANCE_NAME=GRP1_MPP_EP11 PORT_NUM=5237
机器1初始化主库2的备库
./dminit PATH=/dm/data PAGE_SIZE=16 CASE_SENSITIVE=y CHARSET=0 DB_NAME=DAMENG22 INSTANCE_NAME=GRP1_MPP_EP22 PORT_NUM=5237
数据的备份与还原
主库1数据备份
./dmrman CTLSTMT="BACKUP DATABASE '/dm/data/DAMENG1/dm.ini' FULL TO BACKUP_FILE1 BACKUPSET '/dm/data/BACKUP_FILE_01'"
主库2数据备份
./dmrman CTLSTMT="BACKUP DATABASE '/dm/data/DAMENG2/dm.ini' FULL TO BACKUP_FILE1 BACKUPSET '/dm/data/BACKUP_FILE_02'"
主库1的备库数据还原
./dmrman CTLSTMT="RESTORE DATABASE '/dm/data/DAMENG11/dm.ini' FROM BACKUPSET '/dm/data/BACKUP_FILE_01'"
./dmrman CTLSTMT="RECOVER DATABASE '/dm/data/DAMENG11/dm.ini' FROM BACKUPSET '/dm/data/BACKUP_FILE_01'"
./dmrman CTLSTMT="RECOVER DATABASE '/dm/data/DAMENG11/dm.ini' UPDATE DB_MAGIC"
主库2的备库数据还原
./dmrman CTLSTMT="RESTORE DATABASE '/dm/data/DAMENG22/dm.ini' FROM BACKUPSET '/dm/data/BACKUP_FILE_02'"
./dmrman CTLSTMT="RECOVER DATABASE '/dm/data/DAMENG22/dm.ini' FROM BACKUPSET '/dm/data/BACKUP_FILE_02'"
./dmrman CTLSTMT="RECOVER DATABASE '/dm/data/DAMENG22/dm.ini' UPDATE DB_MAGIC"
数据归档
四个数据库都需要开启归档,归档路径放在实例化数据库的arch目录下
alter database mount;
alter database add archivelog ‘dest=/dm/data/DAMENG1/arch,type=local,file_size=1024’;
alter database archivelog;
alter database open;
主库1配置
配置dm.ini
INSTANCE_NAME = GRP1_MPP_EP01
PORT_NUM = 5236 #数据库实例监听端口
DW_INACTIVE_INTERVAL = 60 #接收守护进程消息超时时间
ALTER_MODE_STATUS = 0 #不允许手工方式修改实例模式/状态/OGUID ENABLE_OFFLINE_TS = 2 #不允许备库 OFFLINE 表空间
MAL_INI = 1 #打开 MAL 系统
ARCH_INI = 1 #打开归档配置
MPP_INI = 1 #启用 MPP 配置
RLOG_SEND_APPLY_MON = 64 #统计最近 64 次的日志发送信息
配置dmmal.ini
MAL_CHECK_INTERVAL = 5 #MAL 链路检测时间间隔
MAL_CONN_FAIL_INTERVAL = 5 #判定 MAL 链路断开的时间
[MAL_INST1]
MAL_INST_NAME = GRP1_MPP_EP01 #实例名,和 dm.ini 中的 INSTANCE_NAME 一致
MAL_HOST = 192.168.186.100 #MAL 系统监听 TCP 连接的 IP 地址
MAL_PORT = 6337 #MAL 系统监听 TCP 连接的端口
MAL_INST_HOST = 192.168.186.110 #实例的对外服务 IP 地址
MAL_INST_PORT = 5236 #实例的对外服务端口,和 dm.ini 中的 PORT_NUM 一致
MAL_DW_PORT = 6253 #实例对应的守护进程监听 TCP 连接的端口
MAL_INST_DW_PORT = 6243 #实例监听守护进程 TCP 连接的端口
[MAL_INST2]
MAL_INST_NAME = GRP2_MPP_EP02
MAL_HOST = 192.168.186.101
MAL_PORT = 6337
MAL_INST_HOST = 192.168.186.109
MAL_INST_PORT = 5236
MAL_DW_PORT = 6253
MAL_INST_DW_PORT = 6243
[MAL_INST3]
MAL_INST_NAME = GRP1_MPP_EP11
MAL_HOST = 192.168.186.101
MAL_PORT = 6338
MAL_INST_HOST = 192.168.186.109
MAL_INST_PORT = 5237
MAL_DW_PORT = 6254
MAL_INST_DW_PORT = 6244
[MAL_INST4]
MAL_INST_NAME = GRP2_MPP_EP22
MAL_HOST = 192.168.186.100
MAL_PORT = 6338
MAL_INST_HOST = 192.168.186.110
MAL_INST_PORT = 5237
MAL_DW_PORT = 6254
MAL_INST_DW_PORT = 6244
配置dmarch.ini
[ARCHIVE_REALTIME1]
ARCH_TYPE = REALTIME #实时归档类型
ARCH_DEST = GRP1_MPP_EP11 #实时归档目标实例名
[ARCHIVE_LOCAL1]
ARCH_TYPE = LOCAL
ARCH_DEST = /dm/data/DAMENG1/arch
ARCH_FILE_SIZE = 1024
ARCH_SPACE_LIMIT = 0
配置dmmpp.ctl
dmmpp.ctl 是二进制文件,由 dmmpp.ini 文本通过 dmctlcvt 工具转换而来。
[service_name1]
mpp_seq_no = 0
mpp_inst_name = GRP1_MPP_EP01
[service_name2]
mpp_seq_no = 1
mpp_inst_name = GRP2_MPP_EP02
进入安装目录的bin目录下执行
./dmctlcvt TYPE=2 SRC=/dm/data /DAMENG1/dmmpp.ini DEST=/dm/data /DAMENG1/dmmpp.ctl
主库1启动
在安装的bin目录下以mount方式启动服务
./dmserver /dm/data/DAMENG1/dm.ini mount
启动命令行工具 DIsql,使用 MPP 类型为 LOCAL 方式,登录主库设置 OGUID 值。
./disql SYSDBA/SYSDBA*LOCAL
SP_SET_PARA_VALUE(1, 'ALTER_MODE_STATUS', 1);
sp_set_oguid(45330);
SP_SET_PARA_VALUE(1, 'ALTER_MODE_STATUS', 0);
修改为主库模式
alter database primary;
主库2配置
配置dm.ini
INSTANCE_NAME = GRP2_MPP_EP02
PORT_NUM = 5236 #数据库实例监听端口
DW_INACTIVE_INTERVAL = 60 #接收守护进程消息超时时间
ALTER_MODE_STATUS = 0 #不允许手工方式修改实例模式/状态/OGUID ENABLE_OFFLINE_TS = 2 #不允许备库 OFFLINE 表空间
MAL_INI = 1 #打开 MAL 系统
ARCH_INI = 1 #打开归档配置
MPP_INI = 1 #启用 MPP 配置
RLOG_SEND_APPLY_MON = 64 #统计最近 64 次的日志发送信息
配置dmmal.ini
MAL_CHECK_INTERVAL = 5 #MAL 链路检测时间间隔
MAL_CONN_FAIL_INTERVAL = 5 #判定 MAL 链路断开的时间
[MAL_INST1]
MAL_INST_NAME = GRP1_MPP_EP01 #实例名,和 dm.ini 中的 INSTANCE_NAME 一致
MAL_HOST = 192.168.186.100 #MAL 系统监听 TCP 连接的 IP 地址
MAL_PORT = 6337 #MAL 系统监听 TCP 连接的端口
MAL_INST_HOST = 192.168.186.110 #实例的对外服务 IP 地址
MAL_INST_PORT = 5236 #实例的对外服务端口,和 dm.ini 中的 PORT_NUM 一致
MAL_DW_PORT = 6253 #实例对应的守护进程监听 TCP 连接的端口
MAL_INST_DW_PORT = 6243 #实例监听守护进程 TCP 连接的端口
[MAL_INST2]
MAL_INST_NAME = GRP2_MPP_EP02
MAL_HOST = 192.168.186.101
MAL_PORT = 6337
MAL_INST_HOST = 192.168.186.109
MAL_INST_PORT = 5236
MAL_DW_PORT = 6253
MAL_INST_DW_PORT = 6243
[MAL_INST3]
MAL_INST_NAME = GRP1_MPP_EP11
MAL_HOST = 192.168.186.101
MAL_PORT = 6338
MAL_INST_HOST = 192.168.186.109
MAL_INST_PORT = 5237
MAL_DW_PORT = 6254
MAL_INST_DW_PORT = 6244
[MAL_INST4]
MAL_INST_NAME = GRP2_MPP_EP22
MAL_HOST = 192.168.186.100
MAL_PORT = 6338
MAL_INST_HOST = 192.168.186.110
MAL_INST_PORT = 5237
MAL_DW_PORT = 6254
MAL_INST_DW_PORT = 6244
配置dmarch.ini
[ARCHIVE_REALTIME1]
ARCH_TYPE = REALTIME #实时归档类型
ARCH_DEST = GRP2_MPP_EP22 #实时归档目标实例名
[ARCHIVE_LOCAL1]
ARCH_TYPE = LOCAL
ARCH_DEST = /dm/data/DAMENG2/arch
ARCH_FILE_SIZE = 1024
ARCH_SPACE_LIMIT = 0
配置dmmpp.ctl
dmmpp.ctl 是二进制文件,由 dmmpp.ini 文本通过 dmctlcvt 工具转换而来。
[service_name1]
mpp_seq_no = 0
mpp_inst_name = GRP1_MPP_EP01
[service_name2]
mpp_seq_no = 1
mpp_inst_name = GRP2_MPP_EP02
进入安装目录的bin目录下执行
./dmctlcvt TYPE=2 SRC=/dm/data /DAMENG2/dmmpp.ini DEST=/dm/data /DAMENG2/dmmpp.ctl
主库2启动
在安装的bin目录下以mount方式启动服务
./dmserver /dm/data/DAMENG2/dm.ini mount
启动命令行工具 DIsql,使用 MPP 类型为 LOCAL 方式,登录主库设置 OGUID 值。
./disql SYSDBA/SYSDBA*LOCAL
SP_SET_PARA_VALUE(1, 'ALTER_MODE_STATUS', 1);
sp_set_oguid(45331);
SP_SET_PARA_VALUE(1, 'ALTER_MODE_STATUS', 0);
修改为主库模式
alter database primary;
配置主库1的备库
配置dm.ini
INSTANCE_NAME =GRP1_MPP_EP11
PORT_NUM = 5237
DW_INACTIVE_INTERVAL = 60
ALTER_MODE_STATUS = 0
ENABLE_OFFLINE_TS = 2
MAL_INI = 1
ARCH_INI = 1
MPP_INI = 1
RLOG_SEND_APPLY_MON = 64
配置dmmal.ini
MAL_CHECK_INTERVAL = 5 #MAL 链路检测时间间隔
MAL_CONN_FAIL_INTERVAL = 5 #判定 MAL 链路断开的时间
[MAL_INST1]
MAL_INST_NAME = GRP1_MPP_EP01 #实例名,和 dm.ini 中的 INSTANCE_NAME 一致
MAL_HOST = 192.168.186.100 #MAL 系统监听 TCP 连接的 IP 地址
MAL_PORT = 6337 #MAL 系统监听 TCP 连接的端口
MAL_INST_HOST = 192.168.186.110 #实例的对外服务 IP 地址
MAL_INST_PORT = 5236 #实例的对外服务端口,和 dm.ini 中的 PORT_NUM 一致
MAL_DW_PORT = 6253 #实例对应的守护进程监听 TCP 连接的端口
MAL_INST_DW_PORT = 6243 #实例监听守护进程 TCP 连接的端口
[MAL_INST2]
MAL_INST_NAME = GRP2_MPP_EP02
MAL_HOST = 192.168.186.101
MAL_PORT = 6337
MAL_INST_HOST = 192.168.186.109
MAL_INST_PORT = 5236
MAL_DW_PORT = 6253
MAL_INST_DW_PORT = 6243
[MAL_INST3]
MAL_INST_NAME = GRP1_MPP_EP11
MAL_HOST = 192.168.186.101
MAL_PORT = 6338
MAL_INST_HOST = 192.168.186.109
MAL_INST_PORT = 5237
MAL_DW_PORT = 6254
MAL_INST_DW_PORT = 6244
[MAL_INST4]
MAL_INST_NAME = GRP2_MPP_EP22
MAL_HOST = 192.168.186.100
MAL_PORT = 6338
MAL_INST_HOST = 192.168.186.110
MAL_INST_PORT = 5237
MAL_DW_PORT = 6254
MAL_INST_DW_PORT = 6244
配置dmarch.ini
[ARCHIVE_REALTIME1]
ARCH_TYPE = REALTIME #实时归档类型
ARCH_DEST = GRP1_MPP_EP01 #实时归档目标实例名
[ARCHIVE_LOCAL1]
ARCH_TYPE = LOCAL
ARCH_DEST = /dm/data/DAMENG11/arch
ARCH_FILE_SIZE = 1024
ARCH_SPACE_LIMIT = 0
配置dmmpp.ctl
dmmpp.ctl 是二进制文件,由 dmmpp.ini 文本通过 dmctlcvt 工具转换而来。
[service_name1]
mpp_seq_no = 0
mpp_inst_name = GRP1_MPP_EP01
[service_name2]
mpp_seq_no = 1
mpp_inst_name = GRP2_MPP_EP02
进入安装目录的bin目录下执行
./dmctlcvt TYPE=2 SRC=/dm/data /DAMENG11/dmmpp.ini DEST=/dm/data /DAMENG11/dmmpp.ctl
启动主库1的备库
./dmserver /dm/data/DAMENG11/dm.ini mount
启动命令行工具 DIsql。
./disql SYSDBA/SYSDBA:5237
SP_SET_PARA_VALUE(1, 'ALTER_MODE_STATUS', 1);
sp_set_oguid(45330);
SP_SET_PARA_VALUE(1, 'ALTER_MODE_STATUS', 0);
修改为备库模式
alter database standby;
主库2的备库配置
配置dm.ini
INSTANCE_NAME =GRP2_MPP_EP22
PORT_NUM = 5237
DW_INACTIVE_INTERVAL = 60
ALTER_MODE_STATUS = 0
ENABLE_OFFLINE_TS = 2
MAL_INI = 1
ARCH_INI = 1
MPP_INI = 1
RLOG_SEND_APPLY_MON = 64
配置dmmal.ini
MAL_CHECK_INTERVAL = 5 #MAL 链路检测时间间隔
MAL_CONN_FAIL_INTERVAL = 5 #判定 MAL 链路断开的时间
[MAL_INST1]
MAL_INST_NAME = GRP1_MPP_EP01 #实例名,和 dm.ini 中的 INSTANCE_NAME 一致
MAL_HOST = 192.168.186.100 #MAL 系统监听 TCP 连接的 IP 地址
MAL_PORT = 6337 #MAL 系统监听 TCP 连接的端口
MAL_INST_HOST = 192.168.186.110 #实例的对外服务 IP 地址
MAL_INST_PORT = 5236 #实例的对外服务端口,和 dm.ini 中的 PORT_NUM 一致
MAL_DW_PORT = 6253 #实例对应的守护进程监听 TCP 连接的端口
MAL_INST_DW_PORT = 6243 #实例监听守护进程 TCP 连接的端口
[MAL_INST2]
MAL_INST_NAME = GRP2_MPP_EP02
MAL_HOST = 192.168.186.101
MAL_PORT = 6337
MAL_INST_HOST = 192.168.186.109
MAL_INST_PORT = 5236
MAL_DW_PORT = 6253
MAL_INST_DW_PORT = 6243
[MAL_INST3]
MAL_INST_NAME = GRP1_MPP_EP11
MAL_HOST = 192.168.186.101
MAL_PORT = 6338
MAL_INST_HOST = 192.168.186.109
MAL_INST_PORT = 5237
MAL_DW_PORT = 6254
MAL_INST_DW_PORT = 6244
[MAL_INST4]
MAL_INST_NAME = GRP2_MPP_EP22
MAL_HOST = 192.168.186.100
MAL_PORT = 6338
MAL_INST_HOST = 192.168.186.110
MAL_INST_PORT = 5237
MAL_DW_PORT = 6254
MAL_INST_DW_PORT = 6244
配置dmarch.ini
[ARCHIVE_REALTIME1]
ARCH_TYPE = REALTIME #实时归档类型
ARCH_DEST = GRP2_MPP_EP02 #实时归档目标实例名
[ARCHIVE_LOCAL1]
ARCH_TYPE = LOCAL
ARCH_DEST = /dm/data/DAMENG22/arch
ARCH_FILE_SIZE = 1024
ARCH_SPACE_LIMIT = 0
配置dmmpp.ctl
dmmpp.ctl 是二进制文件,由 dmmpp.ini 文本通过 dmctlcvt 工具转换而来。
[service_name1]
mpp_seq_no = 0
mpp_inst_name = GRP1_MPP_EP01
[service_name2]
mpp_seq_no = 1
mpp_inst_name = GRP2_MPP_EP02
进入安装目录的bin目录下执行
./dmctlcvt TYPE=2 SRC=/dm/data /DAMENG22/dmmpp.ini DEST=/dm/data /DAMENG22/dmmpp.ctl
启动主库2的备库
./dmserver /dm/data/DAMENG22/dm.ini mount
启动命令行工具 DIsql
./disql SYSDBA/SYSDBA:5237
SP_SET_PARA_VALUE(1, 'ALTER_MODE_STATUS', 1);
sp_set_oguid(45331);
SP_SET_PARA_VALUE(1, 'ALTER_MODE_STATUS', 0);
修改为备库模式
alter database standby;
配置机器1的dmwatcher.ini
[GRP1]
DW_TYPE = GLOBAL #全局守护类型
DW_MODE = AUTO #自动切换模式
DW_ERROR_TIME = 10 #远程守护进程故障认定时间
INST_RECOVER_TIME = 60 #主库守护进程启动恢复的间隔时间
INST_ERROR_TIME = 10 #本地实例故障认定时间
INST_OGUID = 45330 #守护系统唯一 OGUID 值
INST_INI = /dm/data/DAMENG1/dm.ini #dm.ini 配置文件路径
INST_AUTO_RESTART = 1 #打开实例的自动启动功能
INST_STARTUP_CMD = /home/dmdba/dmdbms/bin/dmserver #命令行方式启动
RLOG_SEND_THRESHOLD = 0 #指定主库发送日志到备库的时间阈值,默认关闭
RLOG_APPLY_THRESHOLD = 0 #指定备库重演日志的时间阈值,默认关闭
[GRP2]
DW_TYPE = GLOBAL #全局守护类型
DW_MODE = AUTO #自动切换模式
DW_ERROR_TIME = 10 #远程守护进程故障认定时间
INST_RECOVER_TIME = 60 #主库守护进程启动恢复的间隔时间
INST_ERROR_TIME = 10 #本地实例故障认定时间
INST_OGUID = 45331 #守护系统唯一 OGUID 值
INST_INI = /dm/data/DAMENG22/dm.ini #dm.ini 配置文件路径
INST_AUTO_RESTART = 1 #打开实例的自动启动功能
INST_STARTUP_CMD = /home/dmdba/dmdbms/bin/dmserver #命令行方式启动
RLOG_SEND_THRESHOLD = 0 #指定主库发送日志到备库的时间阈值,默认关闭
RLOG_APPLY_THRESHOLD = 0 #指定备库重演日志的时间阈值,默认关闭
配置机器2的dmwatcher.ini
[GRP2]
DW_TYPE = GLOBAL #全局守护类型
DW_MODE = AUTO #自动切换模式
DW_ERROR_TIME = 10 #远程守护进程故障认定时间
INST_RECOVER_TIME = 60 #主库守护进程启动恢复的间隔时间
INST_ERROR_TIME = 10 #本地实例故障认定时间
INST_OGUID = 45331 #守护系统唯一 OGUID 值
INST_INI = /dm/data/DAMENG2/dm.ini #dm.ini 配置文件路径
INST_AUTO_RESTART = 1 #打开实例的自动启动功能
INST_STARTUP_CMD = /home/dmdba/dmdbms/bin/dmserver #命令行方式启动
RLOG_SEND_THRESHOLD = 0 #指定主库发送日志到备库的时间阈值,默认关闭
RLOG_APPLY_THRESHOLD = 0 #指定备库重演日志的时间阈值,默认关闭
[GRP1]
DW_TYPE = GLOBAL #全局守护类型
DW_MODE = AUTO #自动切换模式
DW_ERROR_TIME = 10 #远程守护进程故障认定时间
INST_RECOVER_TIME = 60 #主库守护进程启动恢复的间隔时间
INST_ERROR_TIME = 10 #本地实例故障认定时间
INST_OGUID = 45330 #守护系统唯一 OGUID 值
INST_INI = /dm/data/DAMENG11/dm.ini #dm.ini 配置文件路径
INST_AUTO_RESTART = 1 #打开实例的自动启动功能
INST_STARTUP_CMD = /home/dmdba/dmdbms/bin/dmserver #命令行方式启动
RLOG_SEND_THRESHOLD = 0 #指定主库发送日志到备库的时间阈值,默认关闭
RLOG_APPLY_THRESHOLD = 0 #指定备库重演日志的时间阈值,默认关闭
在机器2上配置监视器dmmonitor.ini
MON_DW_CONFIRM = 1 #确认监视器模式
MON_LOG_PATH = /dm/data/DAMENG2/log #监视器日志文件存放路径
MON_LOG_INTERVAL = 60 #每隔 60s 定时记录系统信息到日志文件 MON_LOG_FILE_SIZE = 32 #每个日志文件最大 32M
MON_LOG_SPACE_LIMIT = 0 #不限定日志文件总占用空间
[GRP1]
MON_INST_OGUID = 45330 #组 GRP1 的唯一 OGUID 值 #以下配置为监视器到组 GRP1 的守护进程的连接信息,以―IP:PORT‖的形式配置 #IP 对应 dmmal.ini 中的 MAL_HOST,PORT 对应 dmmal.ini 中的 MAL_DW_PORT
MON_DW_IP = 192.168.186.100:6253
MON_DW_IP = 192.168.186.101:6254
[GRP2]
MON_INST_OGUID = 45331
MON_DW_IP = 192.168.186.101:6253
MON_DW_IP = 192.168.186.100:6254
启动守护进行
./dmwatcher /dm/data/DAMENG1/dmwatcher.ini
./dmwatcher /dm/data/DAMENG2/dmwatcher.ini
主库、备库均处于open状态
启动监视器
./dmmonitor /dm/data/DAMENG2/dmmonitor.ini
使用MPP方式登录在主库1进行新建表和添加数据在备库里可以查询到
使用MPP方式登录在主库2进行新建表和添加数据在备库里可以查询到
测试通过服务名连接MPP,连接可自动负载到不同节点。
1.在/etc目录下编辑dm_scv.conf配置文件
TIME_ZONE=(480)
LANGUAGE=(cn)
DM=(192.168.186.100:5236,192.168.186.101:5236)
重启服务,使用DISQL用户名登录
节点1通过服务器连接MPP可以连接可自动负载到节点2节点。
节点2通过服务器连接MPP可以连接可自动负载到节点1节点。
测试故障一个节点后,集群和持续提供服务
节点1故障后,节点2可持续提供服务