DM大规模并处处理MPP
一、概述
1.1、系统架构
目前一些主流的数据库系统架构如下:
- DM MPP
采用的完全对等无共享体系架构,结合了完全无共享体系的优点,在此基础上又前进了一步,不采用增加主控制节点来协调所有并行处理的主从式方法,而是各个节点完全对等,更进一步简化了体系的实现,也消除了系统可能存在的主节点瓶颈问题。
- DM MPP 中的每一个 DM 数据库服务器实例作为一个执行节点,简称 EP。客户端可连接任意一个 EP 节点进行操作,所有 EP 对客户来说都是对等的。
- DM MPP 系统内每个 EP 只负责自身部分数据的读写,执行计划在所有 EP 并行执行,能充分利用各 EP 的计算能力及发挥各 EP 独立存储的优势。数据只在必要时通过 DM 的高速邮件 MAL 系统在 EP间传递。当通信代价占整体执行代价的比例较小时,更能体现大规模并行处理的优势,随着系统规模的扩大,并行支路越多,优势越明显。
1.2、原理概述
在 DM MPP 中,数据根据用户指定的分布规则分布在不同的 EP 上。MPP 的核心在于对用户请求的并行执行,其执行流程可简单描述如下:
- 用户选择一个 EP 登录,此时该 EP 就是此用户的主 EP,集群中的其余 EP 都是此用户的从 EP;
- 主 EP 接受用户的 SQL 请求,并生成并行执行计划;
- 主 EP 将计划打包后分发给其他从 EP;
- 各 EP 并行执行;
- 主 EP 收集各 EP(包括自己)的执行结果;
- 主 EP 将执行结果汇总后返回给用户。
1.3、系统特性
使用 DM MPP 可获得以下功能特性支持:
- TB/PB 级数据分析:支持数据的并行装载和操作的并行执行,数据分布式存储在各 EP 中,能支持 TB/PB级数据分析。
- 支持绝大部分单机功能:DM 大规模并行处理 MPP、支持绝大部分的 DM
单机版功能,同时支持行、列存储,支持存储过程、触发器、索引、分区表、多媒体数据类型等。 - 高性价比:无需额外配置特殊软、硬件,性价比超高。
- 高可靠性:DM MPP 与 DM 数据守护相结合,为 MPP 系统中的每个 EP 配置一个或多个实时备库,在 EP发生故障时其对应备库能迅速切换为主库继续提供服务,确保系统的高可用性。
- 支持超大型集群:支持最多 1024 个 EP,轻松组建超大型集群
二、MPP并行执行计划
- 在DM数据库中,SQL语句经过一系列的处理最终生成一棵由不同操作符组成的计划树,DM
执行器以自底向上的顺序执行计划树,数据也按自底向上的顺序在计划树中流动并经过各操作符的处理,最终在计划树的根节点生成执行结果。 - 在 DM MPP 环境中各 EP 执行的是并行计划,并行计划是在单节点执行计划的基础上,按照一定规则于适当的位置插入 MPP通讯操作符而生成的。
三、MPP集群搭建(手动切换)
3.1集群规划
服务器配置信息
3.2、配置A机器-MPP1_01库
3.2.1实例、备份数据
--初始化实例
[dmdba@dmp ~]$dminit PATH=/dm8/data/ DB_NAME=MPP1_01 INSTANCE_NAME=MPP1_01 PORT_NUM=5236 PAGE_SIZE=32 LOG_SIZE=2048
--启动服务
[dmdba@dmp ~]$ dmserver /dm8/data/MPP1_01/dm.ini
--开启归档
[dmdba@dmp ~]$ disql SYSDBA/SYSDBA@192.168.10.100:5236
SQL> ALTER DATABASE MOUNT;
SQL> ALTER DATABASE ARCHIVELOG;
SQL> ALTER DATABASE ADD ARCHIVELOG 'DEST=/dm8/data/MPP1_01/arch, TYPE=LOCAL, FILE_SIZE=1024, SPACE_LIMIT=51200';
SQL> ALTER DATABASE OPEN;
--备份数据
SQL> BACKUP DATABASE BACKUPSET '/dm8/data/MPP1_01/bak/BACKUP_FILE';
--修改dm.ini
SQL> SP_SET_PARA_VALUE (2,'PORT_NUM',5236);
SQL> SP_SET_PARA_VALUE (2,'DW_INACTIVE_INTERVAL',60);
SQL> SP_SET_PARA_VALUE (2,'ALTER_MODE_STATUS',0);
SQL> SP_SET_PARA_VALUE (2,'ENABLE_OFFLINE_TS',2);
SQL> SP_SET_PARA_VALUE (2,'MAL_INI',1);
SQL> SP_SET_PARA_VALUE (2,'MPP_INI',1);
SQL> SP_SET_PARA_VALUE (2,'RLOG_SEND_APPLY_MON',64);
3.2.2.替换dmarch.ini
[dmdba@dmp ~]$ vi /dm8/data/MPP1_01/dmarch.ini
[ARCHIVE_LOCAL]
ARCH_TYPE = LOCAL #本地归档类型
ARCH_DEST = /dm8/data/MPP1_01/arch/ #本地归档存放路径
ARCH_FILE_SIZE = 1024 #单个归档大小,单位MB
ARCH_SPACE_LIMIT = 51200 #归档上限,单位MB
[ARCHIVE_REALTIME]
ARCH_TYPE = REALTIME #实时归档类型
ARCH_DEST = MPP1_01B #实时归档目标实例名
3.2.3创建dmmal.ini
[dmdba@dmp ~]$ vi /dm8/data/MPP1_01/dmmal.ini
MAL_CHECK_INTERVAL = 10 #MAL链路检测时间间隔
MAL_CONN_FAIL_INTERVAL = 10 #判定MAL链路断开的时间
MAL_TEMP_PATH = /dm8/data/malpath/MPP1_01/ #临时文件目录
MAL_BUF_SIZE = 512 #单个MAL缓存大小,单位MB
MAL_SYS_BUF_SIZE = 2048 #MAL总大小限制,单位MB
MAL_COMPRESS_LEVEL = 0 #MAL消息压缩等级,0表示不压缩
[MAL_INST1]
MAL_INST_NAME = MPP1_01 #实例名,和 dm.ini中INSTANCE_NAME一致
MAL_HOST = 192.168.10.100 #MAL系统监听TCP连接的IP地址
MAL_PORT = 5336 #MAL系统监听TCP连接的端口
MAL_INST_HOST = 192.168.2.100 #实例的对外服务IP地址
MAL_INST_PORT = 5236 #实例对外服务端口,和dm.ini中PORT_NUM一致
MAL_DW_PORT = 5436 #实例对应的守护进程监听TCP连接的端口
MAL_INST_DW_PORT = 5536 #实例监听守护进程TCP连接的端口
[MAL_INST2]
MAL_INST_NAME = MPP1_01B
MAL_HOST = 192.168.10.101
MAL_PORT = 5337
MAL_INST_HOST = 192.168.2.101
MAL_INST_PORT = 5237
MAL_DW_PORT = 5437
MAL_INST_DW_PORT = 5537
[MAL_INST3]
MAL_INST_NAME = MPP1_02
MAL_HOST = 192.168.10.101
MAL_PORT = 5336
MAL_INST_HOST = 192.168.2.101
MAL_INST_PORT = 5236
MAL_DW_PORT = 5436
MAL_INST_DW_PORT = 5536
[MAL_INST4]
MAL_INST_NAME = MPP1_02B
MAL_HOST = 192.168.10.100
MAL_PORT = 5337
MAL_INST_HOST = 192.168.2.100
MAL_INST_PORT = 5237
MAL_DW_PORT = 5437
MAL_INST_DW_PORT = 5537
3.2.4创建dmmpp.ini
[dmdba@dmp ~]$ vi /dm8/data/MPP1_01/dmmpp.ini
[service_name1]
mpp_seq_no = 0
mpp_inst_name = MPP1_01
[service_name2]
mpp_seq_no = 1
mpp_inst_name = MPP1_02
3.2.5创建dmmpp.ctl
[dmdba@dmp ~]$ /dm8/bin/dmctlcvt t2c /dm8/data/MPP1_01/dmmpp.ini /dm8/data/MPP1_01/dmmpp.ctl
3.2.6创建dmwatcher.ini
[dmdba@dmp ~]$ vi /dm8/data/MPP1_01/dmwatcher.ini
[GMPP1_01]
DW_TYPE = GLOBAL #全局守护类型
DW_MODE = MANUAL #故障手动切换模式
DW_ERROR_TIME = 20 #远程守护进程故障认定时间
INST_ERROR_TIME = 20 #本地实例故障认定时间
INST_RECOVER_TIME = 60 #主库守护进程启动恢复的间隔时间
INST_OGUID = 45331 #守护系统唯一OGUID值
INST_INI = /dm8/data/MPP1_01/dm.ini #dm.ini文件路径
INST_AUTO_RESTART = 1 #打开实例的自动启动功能
INST_STARTUP_CMD = /dm8/bin/dmserver #命令行方式启动
RLOG_SEND_THRESHOLD = 0 #指定主库发送日志到备库的时间阈值,默认关闭
RLOG_APPLY_THRESHOLD = 0 #指定备库重演日志的时间阈值,默认关闭
[GMPP1_02]
DW_TYPE = GLOBAL
DW_MODE = MANUAL
DW_ERROR_TIME = 20
INST_ERROR_TIME = 20
INST_RECOVER_TIME = 60
INST_OGUID = 45332
INST_INI = /dm8/data/MPP1_02/dm.ini
INST_AUTO_RESTART = 1
INST_STARTUP_CMD = /dm8/bin/dmserver
RLOG_SEND_THRESHOLD = 0
RLOG_APPLY_THRESHOLD = 0
3.2.7拷贝实例
--拷贝实例到B机器
[dmdba@dmp ~]$ scp -r /dm8/data/MPP1_01 192.168.10.101:///dm8/data/
3.2.8注册服务
[root@dmp ~]# /dm8/script/root/dm_service_installer.sh -t dmserver -p MPP1_01 -dm_ini /dm8/data/MPP1_01/dm.ini -m mount
[root@dmp ~]# /dm8/script/root/dm_service_installer.sh -t dmwatcher -p MPP1_01 -watcher_ini /dm8/data/MPP1_01/dmwatcher.ini
备注:删除自启
[root@dmp ~]# /dm8/script/root/dm_service_uninstaller.sh -n DmServiceMPP1_01
[root@dmp ~]# /dm8/script/root/dm_service_uninstaller.sh -n DmWatcherServiceMPP1_01
3.3、配置B机器-MPP1_02库
3.3.1实例、备份数据
--初始化实例
[dmdba@dms1 ~]$ /dm8/bin/dminit PATH=/dm8/data/ DB_NAME=MPP1_02 INSTANCE_NAME=MPP1_02 PORT_NUM=5236 PAGE_SIZE=32 LOG_SIZE=2048
--启动服务
[dmdba@dms1 ~]$ /dm8/bin/dmserver /dm8/data/MPP1_02/dm.ini
--开启归档
[dmdba@dms1 ~]$ /dm8/bin/disql SYSDBA/SYSDBA@192.168.10.101:5236
SQL> ALTER DATABASE MOUNT;
SQL> ALTER DATABASE ARCHIVELOG;
SQL> ALTER DATABASE ADD ARCHIVELOG 'DEST=/dm8/data/MPP1_02/arch, TYPE=LOCAL, FILE_SIZE=1024, SPACE_LIMIT=51200';
SQL> ALTER DATABASE OPEN;
--备份数据
SQL> BACKUP DATABASE BACKUPSET '/dm8/data/MPP1_02/bak/BACKUP_FILE';
--修改dm.ini
SQL> SP_SET_PARA_VALUE (2,'PORT_NUM',5236);
SQL> SP_SET_PARA_VALUE (2,'DW_INACTIVE_INTERVAL',60);
SQL> SP_SET_PARA_VALUE (2,'ALTER_MODE_STATUS',0);
SQL> SP_SET_PARA_VALUE (2,'ENABLE_OFFLINE_TS',2);
SQL> SP_SET_PARA_VALUE (2,'MAL_INI',1);
SQL> SP_SET_PARA_VALUE (2,'MPP_INI',1);
SQL> SP_SET_PARA_VALUE (2,'RLOG_SEND_APPLY_MON',64);
3.3.2替换dmarch.ini
[dmdba@dms1 ~]$ vi /dm8/data/MPP1_02/dmarch.ini
[ARCHIVE_LOCAL]
ARCH_TYPE = LOCAL #本地归档类型
ARCH_DEST = /dm8/data/MPP1_02/arch/ #本地归档存放路径
ARCH_FILE_SIZE = 1024 #单个归档大小,单位MB
ARCH_SPACE_LIMIT = 51200 #归档上限,单位MB
[ARCHIVE_REALTIME]
ARCH_TYPE = REALTIME #实时归档类型
ARCH_DEST = MPP1_02B #实时归档目标实例名
3.3.3创建dmmal.ini
[dmdba@dms1 ~]$ vi /dm8/data/MPP1_02/dmmal.ini
MAL_CHECK_INTERVAL = 10 #MAL链路检测时间间隔
MAL_CONN_FAIL_INTERVAL = 10 #判定MAL链路断开的时间
MAL_TEMP_PATH = /dm8/data/malpath/MPP1_02/ #临时文件目录
MAL_BUF_SIZE = 512 #单个MAL缓存大小,单位MB
MAL_SYS_BUF_SIZE = 2048 #MAL总大小限制,单位MB
MAL_COMPRESS_LEVEL = 0 #MAL消息压缩等级,0表示不压缩
[MAL_INST1]
MAL_INST_NAME = MPP1_01 #实例名,和 dm.ini中INSTANCE_NAME一致
MAL_HOST = 192.168.10.100 #MAL系统监听TCP连接的IP地址
MAL_PORT = 5336 #MAL系统监听TCP连接的端口
MAL_INST_HOST = 192.168.2.100 #实例的对外服务IP地址
MAL_INST_PORT = 5236 #实例对外服务端口,和dm.ini中PORT_NUM一致
MAL_DW_PORT = 5436 #实例对应的守护进程监听TCP连接的端口
MAL_INST_DW_PORT = 5536 #实例监听守护进程TCP连接的端口
[MAL_INST2]
MAL_INST_NAME = MPP1_01B
MAL_HOST = 192.168.10.101
MAL_PORT = 5337
MAL_INST_HOST = 192.168.2.101
MAL_INST_PORT = 5237
MAL_DW_PORT = 5437
MAL_INST_DW_PORT = 5537
[MAL_INST3]
MAL_INST_NAME = MPP1_02
MAL_HOST = 192.168.10.101
MAL_PORT = 5336
MAL_INST_HOST = 192.168.2.101
MAL_INST_PORT = 5236
MAL_DW_PORT = 5436
MAL_INST_DW_PORT = 5536
[MAL_INST4]
MAL_INST_NAME = MPP1_02B
MAL_HOST = 192.168.10.100
MAL_PORT = 5337
MAL_INST_HOST = 192.168.2.100
MAL_INST_PORT = 5237
MAL_DW_PORT = 5437
MAL_INST_DW_PORT = 5537
3.3.4创建dmmpp.ini
[dmdba@dms1 ~]$ vi /dm8/data/MPP1_02/dmmpp.ini
[service_name1]
mpp_seq_no = 0
mpp_inst_name = MPP1_01
[service_name2]
mpp_seq_no = 1
mpp_inst_name = MPP1_02
3.3.5创建dmmpp.ctl
[dmdba@dms1 ~]$ /dm8/bin/dmctlcvt t2c /dm8/data/MPP1_02/dmmpp.ini /dm8/data/MPP1_02/dmmpp.ctl
3.3.6创建dmwatcher.ini
[dmdba@dms1 ~]$ vi /dm8/data/MPP1_02/dmwatcher.ini
[GMPP1_01]
DW_TYPE = GLOBAL #全局守护类型
DW_MODE = MANUAL #故障手动切换模式
DW_ERROR_TIME = 20 #远程守护进程故障认定时间
INST_ERROR_TIME = 20 #本地实例故障认定时间
INST_RECOVER_TIME = 60 #主库守护进程启动恢复的间隔时间
INST_OGUID = 45331 #守护系统唯一OGUID值
INST_INI = /dm8/data/MPP1_01/dm.ini #dm.ini文件路径
INST_AUTO_RESTART = 1 #打开实例的自动启动功能
INST_STARTUP_CMD = /dm8/bin/dmserver #命令行方式启动
RLOG_SEND_THRESHOLD = 0 #指定主库发送日志到备库的时间阈值,默认关闭
RLOG_APPLY_THRESHOLD = 0 #指定备库重演日志的时间阈值,默认关闭
[GMPP1_02]
DW_TYPE = GLOBAL
DW_MODE = MANUAL
DW_ERROR_TIME = 20
INST_ERROR_TIME = 20
INST_RECOVER_TIME = 60
INST_OGUID = 45332
INST_INI = /dm8/data/MPP1_02/dm.ini
INST_AUTO_RESTART = 1
INST_STARTUP_CMD = /dm8/bin/dmserver
RLOG_SEND_THRESHOLD = 0
RLOG_APPLY_THRESHOLD = 0
3.3.7拷贝实例
--拷贝实例到A机器
[dmdba@dms1 ~]$ scp -r /dm8/data/MPP1_02 dmdba@192.168.10.100:/dm8/data/
3.3.8注册服务
[root@dms1 ~]# /dm8/script/root/dm_service_installer.sh -t dmserver -p MPP1_02 -dm_ini /dm8/data/MPP1_02/dm.ini -m mount
[root@dms1 ~]# /dm8/script/root/dm_service_installer.sh -t dmwatcher -p MPP1_02 -watcher_ini /dm8/data/MPP1_02/dmwatcher.ini
备注:删除自启
[root@dms1 ~]# /dm8/script/root/dm_service_uninstaller.sh -n DmServiceMPP1_02
[root@dms1 ~]# /dm8/script/root/dm_service_uninstaller.sh -n DmWatcherServiceMPP1_02
3.4、配置B机器-MPP1_01B库
3.4.1修改dm.ini
[dmdba@dms1 ~]$ vi /dm8/data/MPP1_01/dm.ini
INSTANCE_NAME = MPP1_01B #数据库实例名
PORT_NUM = 5237 #数据库实例监听端口
3.4.2替换dmarch.ini
[dmdba@dms1 ~]$ vi /dm8/data/MPP1_01/dmarch.ini
[ARCHIVE_LOCAL]
ARCH_TYPE = LOCAL #本地归档类型
ARCH_DEST = /dm8/data/MPP1_01/arch/ #本地归档存放路径
ARCH_FILE_SIZE = 1024 #单个归档大小,单位MB
ARCH_SPACE_LIMIT = 51200 #归档上限,单位MB
[ARCHIVE_REALTIME]
ARCH_TYPE = REALTIME #实时归档类型
ARCH_DEST = MPP1_01 #实时归档目标实例名
3.4.3相同配置项
与A机器MPP1_01的dmmal.ini、dmmpp.ini、dmmpp.ctl相同
3.4.4注册服务
[root@~]# /dm8/script/root/dm_service_installer.sh -t dmserver -p MPP1_01B -dm_ini /dm8/data/MPP1_01/dm.ini -m mount
备注:删除自启
[root@~]# /dm8/script/root/dm_service_uninstaller.sh -n DmServiceMPP1_01B
3.4.5恢复数据
[dmdba@dms1 ~]$ /dm8/bin/dmrman CTLSTMT="RESTORE DATABASE '/dm8/data/MPP1_01/dm.ini' FROM BACKUPSET '/dm8/data/MPP1_01/bak/BACKUP_FILE'"
[dmdba@dms1 ~]$ /dm8/bin/dmrman CTLSTMT="RECOVER DATABASE '/dm8/data/MPP1_01/dm.ini' FROM BACKUPSET '/dm8/data/MPP1_01/bak/BACKUP_FILE'"
[dmdba@dms1 ~]$ /dm8/bin/dmrman CTLSTMT="RECOVER DATABASE '/dm8/data/MPP1_01/dm.ini' UPDATE DB_MAGIC"
3.5、配置A机器-MPP1_02B库
3.5.1修改dm.ini
[dmdba@dmp ~]$ vi /dm8/data/MPP1_02/dm.ini
INSTANCE_NAME = MPP1_02B #数据库实例名
PORT_NUM = 5237 #数据库实例监听端口
3.5.2替换dmarch.ini
[dmdba@dmp ~]$ vi /dm8/data/MPP1_02/dmarch.ini
[ARCHIVE_LOCAL]
ARCH_TYPE = LOCAL #本地归档类型
ARCH_DEST = /dm8/data/MPP1_02/arch/ #本地归档存放路径
ARCH_FILE_SIZE = 1024 #单个归档大小,单位MB
ARCH_SPACE_LIMIT = 51200 #归档上限,单位MB
[ARCHIVE_REALTIME]
ARCH_TYPE = REALTIME #实时归档类型
ARCH_DEST = MPP1_02 #实时归档目标实例名
3.5.3配置相同项
与B机器MPP1_02的dmmal.ini、dmmpp.ini、dmmpp.ctl相同
3.5.4注册服务
[root@dmp ~]# /dm8/script/root/dm_service_installer.sh -t dmserver -p MPP1_02B -dm_ini /dm8/data/MPP1_02/dm.ini -m mount
备注:删除自启
[root@dmp ~]# /dm8/script/root/dm_service_uninstaller.sh -n DmServiceMPP1_02B
3.5.5恢复数据
[dmdba@dmp ~]$ /dm8/bin/dmrman CTLSTMT="RESTORE DATABASE '/dm8/data/MPP1_02/dm.ini' FROM BACKUPSET '/dm8/data/MPP1_02/bak/BACKUP_FILE'"
[dmdba@dmp ~]$ /dm8/bin/dmrman CTLSTMT="RECOVER DATABASE '/dm8/data/MPP1_02/dm.ini' FROM BACKUPSET '/dm8/data/MPP1_02/bak/BACKUP_FILE'"
[dmdba@dmp ~]$ /dm8/bin/dmrman CTLSTMT="RECOVER DATABASE '/dm8/data/MPP1_02/dm.ini' UPDATE DB_MAGIC"
3.6、配置监视器
1、在各节点数据库的bin目录中 存放非确认监视器配置文件。
2、在确认监视器机器上(非集群节点) 注册确认监视器自启服务。
3.6.1创建dmmonitor_manual.ini
[dmdba@dmm ~]$ vi /dm8/bin/dmmonitor_manual.ini
MON_DW_CONFIRM = 0 #0为非确认,1为确认
MON_LOG_PATH = ../log #监视器日志文件存放路径
MON_LOG_INTERVAL = 60 #每隔 60s 定时记录系统信息到日志文件
MON_LOG_FILE_SIZE = 512 #单个日志大小,单位MB
MON_LOG_SPACE_LIMIT = 2048 #日志上限,单位MB
[GMPP1_01]
MON_INST_OGUID = 45331 #组GMPP1_01的唯一OGUID 值
MON_DW_IP = 192.168.10.100:5436 #IP对应MAL_HOST,PORT对应MAL_DW_PORT
MON_DW_IP = 192.168.10.101:5437
[GMPP1_02]
MON_INST_OGUID = 45332 #组GMPP1_02的唯一OGUID 值
MON_DW_IP = 192.168.10.101:5436
MON_DW_IP = 192.168.10.100:5437
3.6.2注册服务(选做)
[root@dmm ~]# /dm8/script/root/dm_service_installer.sh -t dmmonitor -p Monitor -monitor_ini /dm8/bin/dmmonitor_manual.ini
备注:删除自启
[root@dmm ~]# /dm8/script/root/dm_service_uninstaller.sh -n DmMonitorServiceMonitor
3.6.3监视器使用
3.7、启动服务及查看信息
3.7.1启动数据库并修改参数
A机器-MPP1_01
[dmdba@dmp ~]$ /dm8/bin/DmServiceMPP1_01 start
[dmdba@dmp ~]$ /dm8/bin/disql SYSDBA/SYSDBA@192.168.10.100:5236
SQL> SP_SET_OGUID(45331);
SQL> ALTER DATABASE PRIMARY;
B机器-MPP1_02
[dmdba@dms1 ~]$ /dm8/bin/DmServiceMPP1_02 start
[dmdba@dms1 ~]$ /dm8/bin/disql SYSDBA/SYSDBA@192.168.10.101:5236
SQL> SP_SET_OGUID(45332);
SQL> ALTER DATABASE PRIMARY;
A机器-MPP1_02B
[dmdba@dmp ~]$ /dm8/bin/DmServiceMPP1_02B start
[dmdba@dmp ~]$/dm8/bin/disql SYSDBA/SYSDBA@192.168.10.100:5237
SQL> SP_SET_OGUID(45332);
SQL> SP_SET_PARA_VALUE(1, 'ALTER_MODE_STATUS', 1);
SQL> ALTER DATABASE STANDBY;
SQL> SP_SET_PARA_VALUE(1, 'ALTER_MODE_STATUS', 0);
B机器-MPP1_01B
[dmdba@dms1 ~]$ /dm8/bin/DmServiceMPP1_01B start
[dmdba@dms1 ~]$ /dm8/bin/disql SYSDBA/SYSDBA@192.168.10.101:5237
SQL> SP_SET_OGUID(45331);
SQL> SP_SET_PARA_VALUE(1, 'ALTER_MODE_STATUS', 1);
SQL> ALTER DATABASE STANDBY;
SQL> SP_SET_PARA_VALUE(1, 'ALTER_MODE_STATUS', 0);
3.7.2启动守护进程
A机器:[dmdba@dmp ~]$ /dm8/bin/DmWatcherServiceMPP1_01 start
B机器:[dmdba@dms1 ~]$ /dm8/bin/DmWatcherServiceMPP1_02 start
3.7.3启动监视器
[dmdba@dmm bin]$ DmMonitorServiceMonitor start
Starting DmMonitorServiceMonitor: [ OK ]
--前台启动
[dmdba@dmm bin]$ dmmonitor dmmonitor_manual.ini
[monitor] 2022-06-01 12:16:58: DMMONITOR[4.0] V8
[monitor] 2022-06-01 12:16:58: DMMONITOR[4.0] IS READY.
[monitor] 2022-06-01 12:16:58: 收到守护进程(MPP1_02)消息
WTIME WSTATUS INST_OK INAME ISTATUS IMODE RSTAT N_OPEN FLSN CLSN
2022-06-01 12:16:58 OPEN OK MPP1_02 OPEN PRIMARY VALID 3 37860 37860
[monitor] 2022-06-01 12:16:58: 收到守护进程(MPP1_01)消息
WTIME WSTATUS INST_OK INAME ISTATUS IMODE RSTAT N_OPEN FLSN CLSN
2022-06-01 12:16:58 OPEN OK MPP1_01 OPEN PRIMARY VALID 4 39318 39318
[monitor] 2022-06-01 12:16:58: 收到守护进程(MPP1_01B)消息
WTIME WSTATUS INST_OK INAME ISTATUS IMODE RSTAT N_OPEN FLSN CLSN
2022-06-01 12:16:58 OPEN OK MPP1_01B OPEN STANDBY VALID 4 39317 39317
[monitor] 2022-06-01 12:16:58: 收到守护进程(MPP1_02B)消息
WTIME WSTATUS INST_OK INAME ISTATUS IMODE RSTAT N_OPEN FLSN CLSN
2022-06-01 12:16:58 OPEN OK MPP1_02B OPEN STANDBY VALID 3 37859 37859
输入命令非法,请输入help命令查看帮助信息!
tip
[monitor] 2022-06-01 12:17:06: [!!! 提示:本监视器不是确认监视器,在故障自动切换模式下如果发生主库故障,本监视器无法执行自动接管 !!!]
[monitor] 2022-06-01 12:17:06: 实例MPP1_01[PRIMARY, OPEN, ISTAT_SAME:TRUE]不可加入其他实例,守护进程状态:OPEN,Open记录状态:VALID
[monitor] 2022-06-01 12:17:06: 实例MPP1_01[PRIMARY, OPEN, ISTAT_SAME:TRUE]当前没有命令正在执行
[monitor] 2022-06-01 12:17:06: 实例MPP1_01[PRIMARY, OPEN, ISTAT_SAME:TRUE]运行正常, 守护进程是OPEN状态,守护类型是GLOBAL
[monitor] 2022-06-01 12:17:06: 实例MPP1_01B[STANDBY, OPEN, ISTAT_SAME:TRUE]可加入实例MPP1_01[PRIMARY, OPEN, ISTAT_SAME:TRUE]
[monitor] 2022-06-01 12:17:06: 实例MPP1_01B[STANDBY, OPEN, ISTAT_SAME:TRUE]当前没有命令正在执行
[monitor] 2022-06-01 12:17:06: 实例MPP1_01B[STANDBY, OPEN, ISTAT_SAME:TRUE]运行正常, 守护进程是OPEN状态,守护类型是GLOBAL
[monitor] 2022-06-01 12:17:06: 组(GMPP1_01)当前活动实例运行正常
[monitor] 2022-06-01 12:17:06: 实例MPP1_02[PRIMARY, OPEN, ISTAT_SAME:TRUE]不可加入其他实例,守护进程状态:OPEN,Open记录状态:VALID
[monitor] 2022-06-01 12:17:06: 实例MPP1_02[PRIMARY, OPEN, ISTAT_SAME:TRUE]当前没有命令正在执行
[monitor] 2022-06-01 12:17:06: 实例MPP1_02[PRIMARY, OPEN, ISTAT_SAME:TRUE]运行正常, 守护进程是OPEN状态,守护类型是GLOBAL
[monitor] 2022-06-01 12:17:06: 实例MPP1_02B[STANDBY, OPEN, ISTAT_SAME:TRUE]可加入实例MPP1_02[PRIMARY, OPEN, ISTAT_SAME:TRUE]
[monitor] 2022-06-01 12:17:06: 实例MPP1_02B[STANDBY, OPEN, ISTAT_SAME:TRUE]当前没有命令正在执行
[monitor] 2022-06-01 12:17:06: 实例MPP1_02B[STANDBY, OPEN, ISTAT_SAME:TRUE]运行正常, 守护进程是OPEN状态,守护类型是GLOBAL
[monitor] 2022-06-01 12:17:06: 组(GMPP1_02)当前活动实例运行正常
[monitor] 2022-06-01 12:17:06: 系统当前活动组(有活动PRIMARY实例)的MPP控制文件处于一致状态!
[monitor] 2022-06-01 12:17:06: 所有组中的活动实例运行正常!
i
3.7.4启停集群
启动
A机器:[dmdba@dmp ~]$ /dm8/bin/DmWatcherServiceMPP1_01 start
B机器:[dmdba@~]# /dm8/bin/DmWatcherServiceMPP1_02 start
停止
A机器:[dmdba@dmp ~]$ /dm8/bin/DmWatcherServiceMPP1_01 stop
B机器:[dmdba@dms1 ~]$ /dm8/bin/DmWatcherServiceMPP1_02 stop
A机器:[dmdba@dmp ~]$ /dm8/bin/DmServiceMPP1_01 stop
B机器:[dmdba@dms1 ~]$ /dm8/bin/DmServiceMPP1_02 stop
B机器:[dmdba@dms1 ~]$ /dm8/bin/DmServiceMPP1_01B stop
A机器:[dmdba@dmp ~]$ /dm8/bin/DmServiceMPP1_02B stop
四、MPP集群搭建(自动切换)
参考手动切换步骤进行配置,唯一区别如下:
4.1修改所有dmwatcher.ini文件中DW_MODE参数
[dmdba@dmp ~]$ vi /dm8/data/MPP1_01/dmwatcher.ini
[GMPP1_01]
DW_TYPE = GLOBAL #全局守护类型
DW_MODE = AUTO #故障手动切换模式
DW_ERROR_TIME = 20 #远程守护进程故障认定时间
INST_ERROR_TIME = 20 #本地实例故障认定时间
INST_RECOVER_TIME = 60 #主库守护进程启动恢复的间隔时间
INST_OGUID = 45331 #守护系统唯一OGUID值
INST_INI = /dm8/data/MPP1_01/dm.ini #dm.ini文件路径
INST_AUTO_RESTART = 1 #打开实例的自动启动功能
INST_STARTUP_CMD = /dm8/bin/dmserver #命令行方式启动
RLOG_SEND_THRESHOLD = 0 #指定主库发送日志到备库的时间阈值,默认关闭
RLOG_APPLY_THRESHOLD = 0 #指定备库重演日志的时间阈值,默认关闭
[GMPP1_02]
DW_TYPE = GLOBAL
DW_MODE = AUTO
DW_ERROR_TIME = 20
INST_ERROR_TIME = 20
INST_RECOVER_TIME = 60
INST_OGUID = 45332
INST_INI = /dm8/data/MPP1_02/dm.ini
INST_AUTO_RESTART = 1
INST_STARTUP_CMD = /dm8/bin/dmserver
RLOG_SEND_THRESHOLD = 0
RLOG_APPLY_THRESHOLD = 0
4.2创建新dmmonitor_auto.ini文件
[dmdba@dmm ~]$ vi /dm8/bin/dmmonitor_manual.ini
MON_DW_CONFIRM = 1 #0为非确认,1为确认
MON_LOG_PATH = ../log #监视器日志文件存放路径
MON_LOG_INTERVAL = 60 #每隔 60s 定时记录系统信息到日志文件
MON_LOG_FILE_SIZE = 512 #单个日志大小,单位MB
MON_LOG_SPACE_LIMIT = 2048 #日志上限,单位MB
[GMPP1_01]
MON_INST_OGUID = 45331 #组GMPP1_01的唯一OGUID 值
MON_DW_IP = 192.168.10.100:5436 #IP对应MAL_HOST,PORT对应MAL_DW_PORT
MON_DW_IP = 192.168.10.101:5437
[GMPP1_02]
MON_INST_OGUID = 45332 #组GMPP1_02的唯一OGUID 值
MON_DW_IP = 192.168.10.101:5436
MON_DW_IP = 192.168.10.100:5437
4.3重新启动服务进行查看
[root@dmm root]# ./dm_service_installer.sh -t dmmonitor -p Monitor -monitor_ini /dm8/bin/dmmonitor_auto.ini
Created symlink from /etc/systemd/system/multi-user.target.wants/DmMonitorServiceMonitor.service to /usr/lib/systemd/system/DmMonitorServiceMonitor.service.
创建服务(DmMonitorServiceMonitor)完成
[dmdba@dmm ~]$ DmMonitorServiceMonitor start
Starting DmMonitorServiceMonitor: [ OK ]
[dmdba@dmm ~]$
[dmdba@dmm bin]$ dmmonitor dmmonitor_auto.ini
[monitor] 2022-06-01 13:11:43: DMMONITOR[4.0] V8
[monitor] 2022-06-01 13:11:43: DMMONITOR[4.0] IS READY.
[monitor] 2022-06-01 13:11:43: 收到守护进程(MPP1_02B)消息
WTIME WSTATUS INST_OK INAME ISTATUS IMODE RSTAT N_OPEN FLSN CLSN
2022-06-01 13:11:43 OPEN OK MPP1_02B OPEN STANDBY NULL 3 38953 38953
[monitor] 2022-06-01 13:11:43: 收到守护进程(MPP1_01B)消息
WTIME WSTATUS INST_OK INAME ISTATUS IMODE RSTAT N_OPEN FLSN CLSN
2022-06-01 13:11:43 OPEN OK MPP1_01B OPEN STANDBY NULL 4 40411 40411
[monitor] 2022-06-01 13:11:43: 收到守护进程(MPP1_02)消息
WTIME WSTATUS INST_OK INAME ISTATUS IMODE RSTAT N_OPEN FLSN CLSN
2022-06-01 13:11:43 OPEN OK MPP1_02 OPEN PRIMARY VALID 3 38954 38955
[monitor] 2022-06-01 13:11:43: 收到守护进程(MPP1_01)消息
WTIME WSTATUS INST_OK INAME ISTATUS IMODE RSTAT N_OPEN FLSN CLSN
2022-06-01 13:11:43 OPEN OK MPP1_01 OPEN PRIMARY VALID 4 40412 40413
输入命令非法,请输入help命令查看帮助信息!
tip
[monitor] 2022-06-01 13:11:52: 实例MPP1_01[PRIMARY, OPEN, ISTAT_SAME:TRUE]不可加入其他实例,守护进程状态:OPEN,Open记录状态:VALID
[monitor] 2022-06-01 13:11:52: 实例MPP1_01[PRIMARY, OPEN, ISTAT_SAME:TRUE]当前没有命令正在执行
[monitor] 2022-06-01 13:11:52: 实例MPP1_01[PRIMARY, OPEN, ISTAT_SAME:TRUE]运行正常, 守护进程是OPEN状态,守护类型是GLOBAL
[monitor] 2022-06-01 13:11:52: 实例MPP1_01B[STANDBY, OPEN, ISTAT_SAME:TRUE]可加入实例MPP1_01[PRIMARY, OPEN, ISTAT_SAME:TRUE]
[monitor] 2022-06-01 13:11:52: 实例MPP1_01B[STANDBY, OPEN, ISTAT_SAME:TRUE]当前没有命令正在执行
[monitor] 2022-06-01 13:11:52: 实例MPP1_01B[STANDBY, OPEN, ISTAT_SAME:TRUE]运行正常, 守护进程是OPEN状态,守护类型是GLOBAL
[monitor] 2022-06-01 13:11:52: 组(GMPP1_01)当前活动实例运行正常
[monitor] 2022-06-01 13:11:52: 实例MPP1_02[PRIMARY, OPEN, ISTAT_SAME:TRUE]不可加入其他实例,守护进程状态:OPEN,Open记录状态:VALID
[monitor] 2022-06-01 13:11:52: 实例MPP1_02[PRIMARY, OPEN, ISTAT_SAME:TRUE]当前没有命令正在执行
[monitor] 2022-06-01 13:11:52: 实例MPP1_02[PRIMARY, OPEN, ISTAT_SAME:TRUE]运行正常, 守护进程是OPEN状态,守护类型是GLOBAL
[monitor] 2022-06-01 13:11:52: 实例MPP1_02B[STANDBY, OPEN, ISTAT_SAME:TRUE]可加入实例MPP1_02[PRIMARY, OPEN, ISTAT_SAME:TRUE]
[monitor] 2022-06-01 13:11:52: 实例MPP1_02B[STANDBY, OPEN, ISTAT_SAME:TRUE]当前没有命令正在执行
[monitor] 2022-06-01 13:11:52: 实例MPP1_02B[STANDBY, OPEN, ISTAT_SAME:TRUE]运行正常, 守护进程是OPEN状态,守护类型是GLOBAL
[monitor] 2022-06-01 13:11:52: 组(GMPP1_02)当前活动实例运行正常
[monitor] 2022-06-01 13:11:52: 系统当前活动组(有活动PRIMARY实例)的MPP控制文件处于一致状态!
[monitor] 2022-06-01 13:11:52: 所有组中的活动实例运行正常!
4.4模拟故障看是否自动切换
--shutdown abort实例
[dmdba@dmp MPP1_01]$ disql SYSDBA/SYSDBA@192.168.10.100:5236
服务器[192.168.10.100:5236]:处于主库打开状态
登录使用时间 : 3.951(ms)
disql V8
SQL>
SQL> shutdown abort;
操作已执行
已用时间: 0.441(毫秒). 执行号:0.
--查看监视器
[monitor] 2022-06-01 13:13:45: 实例MPP1_01[PRIMARY, OPEN, ISTAT_SAME:TRUE]故障
WTIME WSTATUS INST_OK INAME ISTATUS IMODE RSTAT N_OPEN FLSN CLSN
2022-06-01 13:13:45 STARTUP ERROR MPP1_01 OPEN PRIMARY VALID 5 41934 41934
[monitor] 2022-06-01 13:13:45: 守护进程(MPP1_01)状态切换 [OPEN-->STARTUP]
WTIME WSTATUS INST_OK INAME ISTATUS IMODE RSTAT N_OPEN FLSN CLSN
2022-06-01 13:13:45 STARTUP ERROR MPP1_01 OPEN PRIMARY VALID 5 41934 41934
[monitor] 2022-06-01 13:13:45: 检测到PRIMARY实例故障,开始对组(GMPP1_01)执行自动接管
[monitor] 2022-06-01 13:13:45: 通知组(GMPP1_01)当前活动的守护进程设置MID
[monitor] 2022-06-01 13:13:45: 通知组(GMPP1_01)当前活动的守护进程设置MID成功
[monitor] 2022-06-01 13:13:45: 通知组(GMPP1_02)当前活动的守护进程设置MID
[monitor] 2022-06-01 13:13:46: 通知组(GMPP1_02)当前活动的守护进程设置MID成功
[monitor] 2022-06-01 13:13:46: 开始使用实例MPP1_01B接管
[monitor] 2022-06-01 13:13:46: 通知守护进程MPP1_01B切换TAKEOVER状态
[monitor] 2022-06-01 13:13:46: 守护进程(MPP1_01B)状态切换 [OPEN-->TAKEOVER]
[monitor] 2022-06-01 13:13:47: 切换守护进程MPP1_01B为TAKEOVER状态成功
[monitor] 2022-06-01 13:13:47: 实例MPP1_01B开始执行SP_SET_GLOBAL_DW_STATUS(0, 7)语句
[monitor] 2022-06-01 13:13:47: 实例MPP1_01B执行SP_SET_GLOBAL_DW_STATUS(0, 7)语句成功
[monitor] 2022-06-01 13:13:47: 实例MPP1_01B开始执行SP_APPLY_KEEP_PKG()语句
[monitor] 2022-06-01 13:13:47: 实例MPP1_01B执行SP_APPLY_KEEP_PKG()语句成功
[monitor] 2022-06-01 13:13:47: 实例MPP1_01B开始执行ALTER DATABASE MOUNT语句
[monitor] 2022-06-01 13:13:47: 实例MPP1_01B执行ALTER DATABASE MOUNT语句成功
[monitor] 2022-06-01 13:13:47: 实例MPP1_01B开始执行ALTER DATABASE PRIMARY语句
[monitor] 2022-06-01 13:13:47: 实例MPP1_01B执行ALTER DATABASE PRIMARY语句成功
[monitor] 2022-06-01 13:13:47: 通知实例MPP1_01B修改所有归档状态无效
[monitor] 2022-06-01 13:13:47: 修改所有实例归档为无效状态成功
[monitor] 2022-06-01 13:13:47: 构造新的MPPCTL文件成功
[monitor] 2022-06-01 13:13:47: 通知更新实例MPP1_01B[PRIMARY, MOUNT, ISTAT_SAME:TRUE]的MPPCTL文件
[monitor] 2022-06-01 13:13:47: 通知实例MPP1_01B[PRIMARY, MOUNT, ISTAT_SAME:TRUE]更新MPPCTL文件成功
[monitor] 2022-06-01 13:13:47: 通知更新实例MPP1_02[PRIMARY, OPEN, ISTAT_SAME:TRUE]的MPPCTL文件
[monitor] 2022-06-01 13:13:47: 通知守护进程MPP1_02切换MPPCTL UPDATE状态
[monitor] 2022-06-01 13:13:47: 守护进程(MPP1_02)状态切换 [OPEN-->MPPCTL UPDATE]
[monitor] 2022-06-01 13:13:48: 切换守护进程MPP1_02为MPPCTL UPDATE状态成功
[monitor] 2022-06-01 13:13:48: 实例MPP1_02开始执行SP_SET_GLOBAL_DW_STATUS(0, 12)语句
[monitor] 2022-06-01 13:13:48: 实例MPP1_02执行SP_SET_GLOBAL_DW_STATUS(0, 12)语句成功
[monitor] 2022-06-01 13:13:48: 实例MPP1_02开始执行SP_SET_GLOBAL_DW_STATUS(12, 0)语句
[monitor] 2022-06-01 13:13:48: 实例MPP1_02执行SP_SET_GLOBAL_DW_STATUS(12, 0)语句成功
[monitor] 2022-06-01 13:13:48: 通知守护进程MPP1_02切换OPEN状态
[monitor] 2022-06-01 13:13:49: 守护进程(MPP1_02)状态切换 [MPPCTL UPDATE-->OPEN]
[monitor] 2022-06-01 13:13:50: 切换守护进程MPP1_02为OPEN状态成功
[monitor] 2022-06-01 13:13:50: 通知实例MPP1_02[PRIMARY, OPEN, ISTAT_SAME:TRUE]更新MPPCTL文件成功
[monitor] 2022-06-01 13:13:50: 实例MPP1_01B开始执行ALTER DATABASE OPEN FORCE语句
[monitor] 2022-06-01 13:13:50: 实例MPP1_01B执行ALTER DATABASE OPEN FORCE语句成功
[monitor] 2022-06-01 13:13:50: 实例MPP1_01B开始执行SP_SET_GLOBAL_DW_STATUS(7, 0)语句
[monitor] 2022-06-01 13:13:50: 实例MPP1_01B执行SP_SET_GLOBAL_DW_STATUS(7, 0)语句成功
[monitor] 2022-06-01 13:13:50: 通知守护进程MPP1_01B切换OPEN状态
[monitor] 2022-06-01 13:13:51: 守护进程(MPP1_01B)状态切换 [TAKEOVER-->OPEN]
[monitor] 2022-06-01 13:13:51: 切换守护进程MPP1_01B为OPEN状态成功
[monitor] 2022-06-01 13:13:51: 通知组(GMPP1_01)的守护进程执行清理操作
[monitor] 2022-06-01 13:13:51: 清理守护进程(MPP1_01)请求成功
[monitor] 2022-06-01 13:13:51: 清理守护进程(MPP1_01B)请求成功
[monitor] 2022-06-01 13:13:51: 通知组(GMPP1_02)的守护进程执行清理操作
[monitor] 2022-06-01 13:13:51: 清理守护进程(MPP1_02)请求成功
[monitor] 2022-06-01 13:13:51: 清理守护进程(MPP1_02B)请求成功
[monitor] 2022-06-01 13:13:51: 使用实例MPP1_01B接管成功
[monitor] 2022-06-01 13:13:51: 组(GMPP1_01)使用实例MPP1_01B自动接管成功
输入命令非法,请输入help命令查看帮助信息!
tip
[monitor] 2022-06-01 13:14:05: 实例MPP1_01B[PRIMARY, OPEN, ISTAT_SAME:TRUE]不可加入其他实例,守护进程状态:OPEN,Open记录状态:VALID
[monitor] 2022-06-01 13:14:05: 实例MPP1_01B[PRIMARY, OPEN, ISTAT_SAME:TRUE]当前没有命令正在执行
[monitor] 2022-06-01 13:14:05: 实例MPP1_01B[PRIMARY, OPEN, ISTAT_SAME:TRUE]运行正常, 守护进程是OPEN状态,守护类型是GLOBAL
[monitor] 2022-06-01 13:14:05: 实例MPP1_01[PRIMARY, OPEN, ISTAT_SAME:TRUE]当前没有命令正在执行
[monitor] 2022-06-01 13:14:05: 实例MPP1_01[PRIMARY, OPEN, ISTAT_SAME:TRUE]故障,请等待守护进程将其自动拉起
[monitor] 2022-06-01 13:14:05: 组(GMPP1_01)中当前有PRIMARY&OPEN的实例,但存在有其他异常实例,请参考上述提示信息进行处理!
[monitor] 2022-06-01 13:14:05: 实例MPP1_02[PRIMARY, OPEN, ISTAT_SAME:TRUE]不可加入其他实例,守护进程状态:OPEN,Open记录状态:VALID
[monitor] 2022-06-01 13:14:05: 实例MPP1_02[PRIMARY, OPEN, ISTAT_SAME:TRUE]当前没有命令正在执行
[monitor] 2022-06-01 13:14:05: 实例MPP1_02[PRIMARY, OPEN, ISTAT_SAME:TRUE]运行正常, 守护进程是OPEN状态,守护类型是GLOBAL
[monitor] 2022-06-01 13:14:05: 实例MPP1_02B[STANDBY, OPEN, ISTAT_SAME:TRUE]可加入实例MPP1_02[PRIMARY, OPEN, ISTAT_SAME:TRUE]
[monitor] 2022-06-01 13:14:05: 实例MPP1_02B[STANDBY, OPEN, ISTAT_SAME:TRUE]当前没有命令正在执行
[monitor] 2022-06-01 13:14:05: 实例MPP1_02B[STANDBY, OPEN, ISTAT_SAME:TRUE]运行正常, 守护进程是OPEN状态,守护类型是GLOBAL
[monitor] 2022-06-01 13:14:05: 组(GMPP1_02)当前活动实例运行正常
[monitor] 2022-06-01 13:14:05: 系统当前活动组(有活动PRIMARY实例)的MPP控制文件处于一致状态!
[monitor] 2022-06-01 13:14:05: 所有组中都存在有PRIMARY&OPEN实例,但仍然存在有异常实例!
[monitor] 2022-06-01 13:14:08: 实例MPP1_01[STANDBY, MOUNT, ISTAT_SAME:TRUE]恢复正常
WTIME WSTATUS INST_OK INAME ISTATUS IMODE RSTAT N_OPEN FLSN CLSN
2022-06-01 13:14:08 STARTUP OK MPP1_01 MOUNT STANDBY INVALID 5 41934 41934
[monitor] 2022-06-01 13:14:09: 守护进程(MPP1_01)状态切换 [STARTUP-->OPEN]
WTIME WSTATUS INST_OK INAME ISTATUS IMODE RSTAT N_OPEN FLSN CLSN
2022-06-01 13:14:09 OPEN OK MPP1_01 OPEN STANDBY INVALID 5 41934 41934
[monitor] 2022-06-01 13:14:19: 守护进程(MPP1_01B)状态切换 [OPEN-->RECOVERY]
WTIME WSTATUS INST_OK INAME ISTATUS IMODE RSTAT N_OPEN FLSN CLSN
2022-06-01 13:14:19 RECOVERY OK MPP1_01B OPEN PRIMARY VALID 6 43302 43302
[monitor] 2022-06-01 13:14:22: 守护进程(MPP1_01B)状态切换 [RECOVERY-->OPEN]
WTIME WSTATUS INST_OK INAME ISTATUS IMODE RSTAT N_OPEN FLSN CLSN
2022-06-01 13:14:22 OPEN OK MPP1_01B OPEN PRIMARY VALID 6 43303 43303
输入命令非法,请输入help命令查看帮助信息!
show global info
2022-06-01 13:14:32
#================================================================================#
GROUP OGUID MON_CONFIRM MODE MPP_FLAG
GMPP1_01 45331 TRUE AUTO TRUE
<<DATABASE GLOBAL INFO:>>
DW_IP MAL_DW_PORT WTIME WTYPE WCTLSTAT WSTATUS INAME INST_OK N_EP N_OK ISTATUS IMODE DSC_STATUS RTYPE RSTAT
192.168.10.101 5437 2022-06-01 13:14:31 GLOBAL VALID OPEN MPP1_01B OK 1 1 OPEN PRIMARY DSC_OPEN REALTIME VALID
DW_IP MAL_DW_PORT WTIME WTYPE WCTLSTAT WSTATUS INAME INST_OK N_EP N_OK ISTATUS IMODE DSC_STATUS RTYPE RSTAT
192.168.10.100 5436 2022-06-01 13:14:31 GLOBAL VALID OPEN MPP1_01 OK 1 1 OPEN STANDBY DSC_OPEN REALTIME VALID
#--------------------------------------------------------------------------------#
2022-06-01 13:14:32
#--------------------------------------------------------------------------------#
GROUP OGUID MON_CONFIRM MODE MPP_FLAG
GMPP1_02 45332 TRUE AUTO TRUE
<<DATABASE GLOBAL INFO:>>
DW_IP MAL_DW_PORT WTIME WTYPE WCTLSTAT WSTATUS INAME INST_OK N_EP N_OK ISTATUS IMODE DSC_STATUS RTYPE RSTAT
192.168.10.101 5436 2022-06-01 13:14:32 GLOBAL VALID OPEN MPP1_02 OK 1 1 OPEN PRIMARY DSC_OPEN REALTIME VALID
DW_IP MAL_DW_PORT WTIME WTYPE WCTLSTAT WSTATUS INAME INST_OK N_EP N_OK ISTATUS IMODE DSC_STATUS RTYPE RSTAT
192.168.10.100 5437 2022-06-01 13:14:32 GLOBAL VALID OPEN MPP1_02B OK 1 1 OPEN STANDBY DSC_OPEN REALTIME VALID
#================================================================================#
五、问题及解决方法
--登录的时候失败
[dmdba@dmp backup_file]$ disql SYSDBA/SYSDBA@192.168.10.100:5236
[-6024]:全局登录时远程节点连接失败.
disql V8
用户名:SYSDBA
密码:
[-6024]:全局登录时远程节点连接失败.
用户名:
密码:
[-6024]:全局登录时远程节点连接失败.
--原因
MPP系统中数据分布在各个EP中,用户只需要登录到某个EP,系统自动建立这个 EP与其余 EP 的连接,因此用户建立的实际上是与整个 MPP 系统的全局连接,用户对数据库的操作通过全局连接在 MPP 系统的所有 EP 进行。使用全局连接时,要求 MPP 系统的所有EP都正常提供服务,否则无法建立接。
--解决,启动MPP1_02实例
[dmdba@dms1 MPP1_01]$ DmServiceMPP1_02 start
Starting DmServiceMPP1_02: [ OK ]
--尝试登录
[dmdba@dmp backup_file]$ disql SYSDBA/SYSDBA@192.168.10.100:5236
服务器[LOCALHOST:5236]:处于普通配置状态
登录使用时间 : 3.198(ms)
disql V8
社区地址:https://eco.dameng.com