MMM
实验环境:
1、OS:centos7(64位) 数据库系统:MySQL5.7.13
关闭selinux
配置ntp时间同步(这里我是用的chrony)
角色 | IP | hostname | server-id | write vip | read vip |
---|---|---|---|---|---|
Master1 | 192.168.24.1128 | Master1 | 1 | 192.168.24.200 | |
Master2(backup) | 192.168.24.129 | Master2 | 2 | 192.168.24.220 | |
Slave1 | 192.168.24.130 | Slave1 | 3 | 192.168.24.230 | |
Slave2 | 192.168.24.131 | Slave2 | 4 | 192.168.24.240 | |
monitor | 192.168.24.132 | Monitor | 无 |
2、在所有主机上配置/etc/hosts 文件,添加如下内容:
192.168.24.10 Master1
192.168.24.20 Master2
192.168.24.30 slave1
192.168.24.40 Slave2
192.168.24.50 Monitor
在 所 有 主 机 上 安 装:
yum -y install perl-* libart_lgpl.x86_64 rrdtool.x86_64 rrdtool-perl.x86_64
安装 perl 的相关库:
cpan -i Algorithm::Diff Class::Singleton DBI DBD::mysql Log::Dispatch Log::Log4perl Mail::Send Net::Ping Proc::Daemon Time::HiRes Params::Validate Net::ARP
配置时间同步服务:
yum -y install chrony.x86_64
vim /etc/chrony.conf
添加这两行
server 192.168.24.128 iburst
allow 192.168.24.0/24
3、在 master1、master2、slave1、slave2 主机上安装 mysql5.7 和配置复制master1 和 master2 互为主从,slave1、slave2 为 master1 的从
在每个 mysql 的配置文件/etc/my.cnf 中加入以下内容, 注意 server-id 不能重复。
master1 主机:
log-bin = mysql-bin
binlog_format = mixed
server-id = 1
relay-log = relay-bin
relay-log-index = slave-relay-bin.index
log-slave-updates = 1
auto-increment-increment = 2
auto-increment-offset = 1
master2 主机:
log-bin = mysql-bin
binlog_format = mixed
server-id = 2
relay-log = relay-bin
relay-log-index = slave-relay-bin.index
log-slave-updates = 1
auto-increment-increment = 2
auto-increment-offset = 2
slave1 主机:
server-id = 3
relay-log = relay-bin
relay-log-index = slave-relay-bin.index
read_only = 1
slave2 主机:
server-id = 4
relay-log = relay-bin
relay-log-index = slave-relay-bin.index
read_only = 1
在完成了对 my.cnf 的修改后,通过 systemctl restart mysqld 重新启动 mysql 服务
4 台数据库主机若要开启防火墙,要么关闭防火墙或者创建访问规则:
firewall-cmd --permanent --add-port=3306/tcp
firewall-cmd --reload
主从配置(master1 和 master2 配置成主主,slave1 和 slave2 配置成 master1 的从):
在 master1、master2上授权:
mysql> grant replication slave on *.* to rep@'192.168.24.%' identified by '123';
把 master2、slave1 和 slave2 配置成 master1 的从库:
change master to master_host='192.168.24.128',master_port=3306,master_user='rep',master_password='123',master_log_file='mysql-bin.000002',master_log_pos=452;
在master2上执行 show master status; 获取 binlog 文件和 Position 点
在master1上执行
change master to master_host='192.168.24.129',master_port=3306,master_user='rep',master_password='123',master_log_file='mysql-bin.000001',master_log_pos=452;
都设置完了开启slave并查看:
Slave_IO_Running 和 Slave_SQL_Running 都为 yes,那么就已经配置 OK 了
4、mysql-mmm 配置:
在 4 台 mysql 节点上创建用户创建代理账号:
mysql> grant replication client on *.* to 'mmm_monitor'@'192.168.24.%' identified by '123';
创建监控账号:
grant super,replication client,process on *.* to 'mmm_agent'@'192.168.24.%' identified by '123';
注 1:因为之前的主从复制,以及主从已经是 ok 的,所以我在 master1 服务器执行就 ok 了。
检查 master1、master2 和 slave1、slave2 三台 db 上是否都存在监控和代理账号
mysql> select user,host from mysql.user where user in ('mmm_monitor','mmm_agent');
+-------------+--------------+
| user | host |
+-------------+--------------+
| mmm_agent | 192.168.24.% |
| mmm_monitor | 192.168.24.% |
+-------------+--------------+
或
mysql> show grants for 'mmm_agent'@'192.168.24.%';
+-------------------------------------------------------------------------------+
| Grants for mmm_agent@192.168.24.% |
+-------------------------------------------------------------------------------+
| GRANT PROCESS, SUPER, REPLICATION CLIENT ON *.* TO 'mmm_agent'@'192.168.24.%' |
+-------------------------------------------------------------------------------+
注:
mmm_monitor 用户:mmm 监控用于对 mysql 服务器进程健康检查
mmm_agent 用户:mmm 代理用来更改只读模式,复制的主服务器等
5、mysql-mmm 安装
在 monitor 主机(192.168.31.106) 上安装监控程序
wget http://pkgs.fedoraproject.org/repo/pkgs/mysql-mmm/mysql-mmm-2.2.1.tar.gz/f5f8b48bdf89251d3183328f0249461e/mysql-mmm-2.2.1.tar.gz
tar -zxf mysql-mmm-2.2.1.tar.gz
cd mysql-mmm-2.2.1
make install
在数据库服务器(master1、master2、slave1、slave2)上安装代理
wget http://pkgs.fedoraproject.org/repo/pkgs/mysql-mmm/mysql-mmm-2.2.1.tar.gz/f5f8b48bdf89251d3183328f0249461e/mysql-mmm-2.2.1.tar.gz
tar -zxf mysql-mmm-2.2.1.tar.gz
cd mysql-mmm-2.2.1
make install
6、配置 mmm
编写配置文件,五台主机必须一致:
完成安装后,所有的配置文件都放到了/etc/mysql-mmm/下面。管理服务器和数据库服务器上都要包含一个共同的文件 mmm_common.conf,内容如下:
详细解释:
active_master_rolewriter#积极的 master 角色的标示,所有的 db 服务器要开启 read_only 参
数,对于 writer 服务器监控代理会自动将 read_only 属性关闭。
<host default>
cluster_interfaceeno16777736#群集的网络接口
pid_path /var/run/mmm_agentd.pid#pid 路径
bin_path /usr/lib/mysql-mmm/#可执行文件路径
replication_user rep#复制用户
replication_password 123456#复制用户密码
agent_usermmm_agent#代理用户
agent_password 123456#代理用户密码
</host>
<host master1>#master1 的 host 名
ip 192.168.31.83#master1 的 ip
mode master#角色属性,master 代表是主
peer master2#与master1对等的服务器的host名,也就是master2的服务器host
名
</host>
<host master2>#和 master 的概念一样
ip 192.168.31.141
mode master
peer master1
</host>
<host slave1>#从库的 host 名,如果存在多个从库可以重复一样的配置
ip 192.168.31.250#从的 ip
mode slave#slave 的角色属性代表当前 host 是从
</host>
<host slave2>#和 slave 的概念一样
ip 192.168.31.225
mode slave
</host>
<role writer>#writer 角色配置
hosts master1,master2#能进行写操作的服务器的 host 名,如果不想切换写操
作这里可以只配置 master,这样也可以避免因为网络延时而进行 write 的切换,但是一旦
master 出现故障那么当前的 MMM 就没有 writer 了只有对外的 read 操作。
ips 192.168.31.2#对外提供的写操作的虚拟 IP
mode exclusive#exclusive 代表只允许存在一个主,也就是只能提供一个写的 IP
</role>
<role reader>#read 角色配置
hosts master2,slave1,slave2#对外提供读操作的服务器的 host 名,当然这里也可以
把 master 加进来
ips 192.168.31.3, 192.168.31.4, 192.168.31.5#对外提供读操作的虚拟 ip,这三个 ip 和
host 不是一一对应的,并且 ips 也 hosts 的数目也可以不相同,如果这样配置的话其中一个
hosts 会分配两个 ip
mode balanced#balanced 代表负载均衡
</role>
本机配置:
active_master_role writer
<host default>
cluster_interface eno16777736
pid_path /var/run/mmm_agentd.pid
bin_path /usr/lib/mysql-mmm/
replication_user rep
replication_password 123
agent_user mmm_agent
agent_password 123
</host>
<host master1>
ip 192.168.24.128
mode master
peer master2
</host>
<host master2>
ip 192.168.24.129
mode master
peer master1
</host>
<host slave1>
ip 192.168.24.130
mode slave
</host>
<host slave2>
ip 192.168.24.131
mode slave
</host>
<role writer>
hosts master1, master2
ips 192.168.24.200
mode exclusive
</role>
<role reader>
hosts master2, slave1, slave2
ips 192.168.24.220, 192.168.24.230, 192.168.24.240
mode balanced
</role>
同时将这个文件拷贝到其它的服务器,配置不变
for host in monitor master1 master2 slave1 slave2 ; do scp /etc/mysql-mmm/mmm_common.conf $host:/etc/mysql-mmm/ ; done
代理文件配置
编辑 4 台 mysql 节点机上的/etc/mysql-mmm/mmm_agent.conf
在数据库服务器上,还有一个 mmm_agent.conf 需要修改,其内容是:
include mmm_common.conf
this master1
注意:这个配置只配置 db 服务器,监控服务器不需要配置,this 后面的 host 名改成当前服务器的主机名。
启动代理进程
在 /etc/init.d/mysql-mmm-agent 的脚本文件的#!/bin/sh 下面,加入如下内容
source /root/.bash_profile
添加成系统服务并设置为自启动
#chkconfig --add mysql-mmm-agent
#chkconfigmysql-mmm-agent on
#/etc/init.d/mysql-mmm-agent start
注:添加 source /root/.bash_profile 目的是为了 mysql-mmm-agent 服务能启机自启。自动启动和手动启动的唯一区别,就是激活一个 console 。那么说明在作为服务启动的时候,可能是由于缺少环境变量
服务启动失败,报错信息如下:
Daemon bin: '/usr/sbin/mmm_agentd'
Daemon pid: '/var/run/mmm_agentd.pid'
Starting MMM Agent daemon... Can't locate Proc/Daemon.pm in @INC (@INC contains: /root/perl5/lib/perl5/5.16.3/x86_64-linux-thread-multi /root/perl5/lib/perl5/5.16.3 /root/perl5/lib/perl5/x86_64-linux-thread-multi /root/perl5/lib/perl5 /usr/local/lib64/perl5 /usr/local/share/perl5 /usr/lib64/perl5/vendor_perl /usr/share/perl5/vendor_perl /usr/lib64/perl5 /usr/share/perl5 .) at /usr/sbin/mmm_agentd line 7.
BEGIN failed--compilation aborted at /usr/sbin/mmm_agentd line 7.
failed
解决方法:
# cpan Proc::Daemon
# cpan Log::Log4perl
在安装一下这两个
# /etc/init.d/mysql-mmm-agent start
Daemon bin: '/usr/sbin/mmm_agentd'
Daemon pid: '/var/run/mmm_agentd.pid'
Starting MMM Agent daemon... Ok
# netstat -antp | grep mmm_agentd
tcp 0 0 192.168.31.83:9989 0.0.0.0:* LISTEN 9693/mmm_agentd
配置防火墙
firewall-cmd --permanent --add-port=9989/tcp
firewall-cmd --reload
编辑 monitor 主机上的/etc/mysql-mmm/mmm_mon.conf
配置文件解释:
includemmm_common.conf
<monitor>
ip 127.0.0.1##为了安全性,设置只在本机监听,mmm_mond 默认监听 9988
pid_path /var/run/mmm_mond.pid
bin_path /usr/lib/mysql-mmm/
status_path/var/lib/misc/mmm_mond.status
ping_ips192.168.31.83,192.168.31.141,192.168.31.250,192.168.31.225#用于测试网络
可用性 IP 地址列表,只要其中有一个地址 ping 通,就代表网络正常,这里不要写入本机
地址
auto_set_online 0#设置自动 online 的时间,默认是超过 60s 就将它设置为 online,默认是
60s,这里将其设为 0 就是立即 online
</monitor>
<check default>
check_period 5
trap_period 10
timeout 2
#restart_after 10000
max_backlog 86400
</check>
check_period
描述:检查周期默认为 5s
默认值:5s
trap_period
描述:一个节点被检测不成功的时间持续 trap_period 秒,就慎重的认为这个节点失败了。
默认值:10s
timeout
描述:检查超时的时间
默认值:2s
restart_after
描述:在完成 restart_after 次检查后,重启 checker 进程
默认值:10000
max_backlog
描述:记录检查 rep_backlog 日志的最大次数
默认值:60
<host default>
monitor_usermmm_monitor#监控 db 服务器的用户
monitor_password 123456#监控 db 服务器的密码
</host>
debug 0#debug 0 正常模式,1 为 debug 模式
本机配置:
include mmm_common.conf
<monitor>
ip 127.0.0.1
pid_path /var/run/mmm_mond.pid
bin_path /usr/lib/mysql-mmm/
status_path /var/lib/misc/mmm_mond.status
ping_ips 192.168.24.128, 192.168.24.129, 192.168.24.130, 192.168.24.131
auto_set_online 0
</monitor>
<check default>
check_period 5
trap_period 10
timeout 2
restart_after 10000
max_backlog 86400
</check>
<host default>
monitor_user mmm_monitor
monitor_password 123
</host>
debug 0
启动监控进程:
在 /etc/init.d/mysql-mmm-agent 的脚本文件的#!/bin/sh 下面,加入如下内容:
source /root/.bash_profile
添加成系统服务并设置为自启动
#chkconfig --add mysql-mmm-monitor
#chkconfigmysql-mmm-monitor on
#/etc/init.d/mysql-mmm-monitor start
启动报错:
Daemon bin: '/usr/sbin/mmm_mond'
Daemon pid: '/var/run/mmm_mond.pid'
Starting MMM Monitor daemon: Can't locate Proc/Daemon.pm in @INC (@INC contains: /root/perl5/lib/perl5/5.16.3/x86_64-linux-thread-multi /root/perl5/lib/perl5/5.16.3 /root/perl5/lib/perl5/x86_64-linux-thread-multi /root/perl5/lib/perl5 /root/perl5/lib/perl5/5.16.3/x86_64-linux-thread-multi /root/perl5/lib/perl5/5.16.3 /root/perl5/lib/perl5/x86_64-linux-thread-multi /root/perl5/lib/perl5 /usr/local/lib64/perl5 /usr/local/share/perl5 /usr/lib64/perl5/vendor_perl /usr/share/perl5/vendor_perl /usr/lib64/perl5 /usr/share/perl5 .) at /usr/sbin/mmm_mond line 11.
BEGIN failed--compilation aborted at /usr/sbin/mmm_mond line 11.
failed
解决方法:安装下列 perl 的库
#cpanProc::Daemon
#cpan Log::Log4perl
[root@monitor1 ~]# /etc/init.d/mysql-mmm-monitor start
Daemon bin: '/usr/sbin/mmm_mond'
Daemon pid: '/var/run/mmm_mond.pid'
Starting MMM Monitor daemon: Ok
[root@monitor ~]# netstat -anpt | grep 9988
tcp 0 0 127.0.0.1:9988 0.0.0.0:* LISTEN 8546/mmm_mond
注 1:无论是在 db 端还是在监控端如果有对配置文件进行修改操作都需要重启代理进程和监控进程。
注 2:MMM 启动顺序:先启动 monitor,再启动 agent
检查集群状态:
[root@monitor mysql-mmm]# mmm_control show
master1(192.168.24.128) master/AWAITING_RECOVERY. Roles:
master2(192.168.24.129) master/AWAITING_RECOVERY. Roles:
slave1(192.168.24.130) slave/AWAITING_RECOVERY. Roles:
slave2(192.168.24.131) slave/AWAITING_RECOVERY. Roles:
如果服务器状态不是 ONLINE,可以用如下命令将服务器上线,例如:
#mmm_controlset_online 主机名
例如:[root@monitor1 ~]#mmm_control set_online master1 (把四台mysql都上线)
[root@monitor mysql-mmm]# mmm_control show
master1(192.168.24.128) master/ONLINE. Roles: writer(192.168.24.200)
master2(192.168.24.129) master/ONLINE. Roles: reader(192.168.24.240)
slave1(192.168.24.130) slave/ONLINE. Roles: reader(192.168.24.220)
slave2(192.168.24.131) slave/ONLINE. Roles: reader(192.168.24.230)
从上面的显示可以看到,写请求的 VIP 在 master1 上,所有从节点也都把 master1 当做主节点。
查看是否启用 vip
在 master2,slave1,slave2 主机上查看主 mysql 的指向
我的都是指向master1就不一一查看了
MMM 高可用性测试:
服务器读写采有 VIP 地址进行读写,出现故障时 VIP 会漂移到其它节点,由其它节点提供服务。
首先查看整个集群的状态,可以看到整个集群状态正常
模拟 master1 宕机,手动停止 mysql 服务,观察 monitor 日志,master1 的日志如下:
查看群集的最新状态
从显示结果可以看出 master1 的状态有 ONLINE 转换为HARD_OFFLINE,写 VIP 转移到了master2 主机上。
检查所有的 db 服务器群集状态
mmm_control checks all
从上面可以看到 master1 能 ping 通,说明只是服务死掉了。
查看 master2 主机的 ip 地址:
slave1 主机:
Slave2 主机:
启动 master1 主机的 mysql 服务,观察 monitor 日志,master1 的日志如下:
从上面可以看到 master1 的状态由 hard_offline 改变为 awaiting_recovery 状态用如下命令将服务器上线:
[root@monitor mysql-mmm]# mmm_control set_online master1
查看群集最新状态
可以看到主库启动不会接管主,只到现有的主再次宕机。
总结
(1)master2 备选主节点宕机不影响集群的状态,就是移除了 master2 备选节点的读状态。
(2)master1 主节点宕机,由 master2 备选主节点接管写角色,slave1,slave2 指向新 master2主库进行复制,slave1,slave2 会自动 change master 到 master2.
(3)如果 master1 主库宕机,master2 复制应用又落后于 master1 时就变成了主可写状态,这时的数据主无法保证一致性。
如果 master2,slave1,slave2 延迟于 master1 主,这个时 master1 宕机,slave1,slave2 将会等待数据追上 db1 后,再重新指向新的主 node2 进行复制操作,这时的数据也无法保证同步的一致性。
(4)如果采用 MMM 高可用架构,主,主备选节点机器配置一样,而且开启半同步进一步提高安全性或采用 MariaDB/mysql5.7 进行多线程从复制,提高复制的性能。
附:
1、日志文件:
日志文件往往是分析错误的关键,所以要善于利用日志文件进行问题分析。
db 端:/var/log/mysql-mmm/mmm_agentd.log
监控端:/var/log/mysql-mmm/mmm_mond.log
2、命令文件:
mmm_agentd:db 代理进程的启动文件
mmm_mond:监控进程的启动文件
mmm_backup:备份文件
mmm_restore:还原文件
mmm_control:监控操作命令文件
db 服务器端只有 mmm_agentd 程序,其它的都是在 monitor 服务器端。
3、mmm_control 用法
mmm_control 程序可以用于监控群集状态、切换 writer、设置 online\offline 操作等。
Valid commands are:
help - show this message #帮助信息
ping - ping monitor #ping 当前的群集是否正常
show - show status #群集在线状态检查
checks [<host>|all [<check>|all]] - show checks status#执行监控检查操作
set_online<host> - set host <host> online #将 host 设置为 online
set_offline<host> - set host <host> offline #将 host 设置为 offline
mode - print current mode. #打印输出当前的 mode
set_active - switch into active mode.
set_manual - switch into manual mode.
set_passive - switch into passive mode.
move_role [--force] <role><host> - move exclusive role <role> to host <host> #移除 writer 服务器
为指定的 host 服务器(Only use --force if you know what you are doing!)
set_ip<ip><host> - set role with ip<ip> to host <host>
检查所有的 db 服务器群集状态:
[root@monitor mysql-mmm]# mmm_control checks all
检查项包括:ping、mysql 是否正常运行、复制线程是否正常等
检查群集环境在线状况:
[root@monitor mysql-mmm]# mmm_control show
对指定的 host 执行 offline 操作:
[root@monitor mysql-mmm]# mmm_control set_online slave1
对指定的 host 执行 onine 操作:
[root@monitor mysql-mmm]# mmm_control set_offline slave1
执行 write 切换(手动切换):
查看当前的 slave 对应的 master
writer 切换,要确保 mmm_common.conf 文件中的 writer 属性有配置对应的 host,否则无法切换
[root@monitor mysql-mmm]# mmm_control move_role writer master1
OK: Role 'writer' has been moved from 'master2' to 'master1'. Now you can wait some time and check new roles info!
[root@monitor mysql-mmm]# mmm_control show
master1(192.168.24.128) master/ONLINE. Roles: writer(192.168.24.200)
master2(192.168.24.129) master/ONLINE. Roles: reader(192.168.24.240)
slave1(192.168.24.130) slave/ONLINE. Roles: reader(192.168.24.220)
slave2(192.168.24.131) slave/ONLINE. Roles: reader(192.168.24.230)
save 从库自动切换到了新的 master
4、其它处理问题
如果不想让 writer 从 master 切换到 backup(包括主从的延时也会导致写 VIP 的切换),那么可以在配置/etc/mysql-mmm/mmm_common.conf 时,去掉<role write>中的 backup
<role writer>#writer 角色配置
hosts master1 #这里只配置一个 Hosts
ips 192.168.31.2#对外提供的写操作的虚拟 IP
mode exclusive #exclusive 代表只允许存在一个主,也就是只能提供一个写的 IP
</role>
这样的话当 master1 出现故障了 writer 写操作不会切换到 master2 服务器,并且 slave 也不会指向新的 master,此时当前的 MMM 之前对外提供写服务。
5、总结
1.对外提供读写的虚拟 IP 是由 monitor 程序控制。如果 monitor 没有启动那么 db 服务器不会被分配虚拟 ip,但是如果已经分配好了虚拟 ip,当 monitor 程序关闭了原先分配的虚拟 ip不会立即关闭外部程序还可以连接访问(只要不重启网络),这样的好处就是对于 monitor的可靠性要求就会低一些,但是如果这个时候其中的某一个 db 服务器故障了就无法处理切换,也就是原先的虚拟 ip 还是维持不变,挂掉的那台 DB 的虚拟 ip 会变的不可访问。
2.agent 程序受 monitor 程序的控制处理 write 切换,从库切换等操作。如果 monitor 进
程关闭了那么 agent 进程就起不到什么作用,它本身不能处理故障。
3.monitor 程序负责监控 db 服务器的状态,包括 Mysql 数据库、服务器是否运行、复制
线程是否正常、主从延时等;它还用于控制 agent 程序处理故障。
4.monitor 会每隔几秒钟监控 db 服务器的状态,如果 db 服务器已经从故障变成了正常,
那么 monitor 会自动在 60s 之后将其设置为 online 状态(默认是 60s 可以设为其它的值),有监控端的配置文件参数“auto_set_online”决定,群集服务器的状态有三种分别是:HARD_OFFLINE→AWAITING_RECOVERY→online
5.默认 monitor 会控制 mmm_agent 会将 writer db 服务器 read_only 修改为 OFF,其它的db 服务器 read_only 修改为 ON,所以为了严谨可以在所有的服务器的 my.cnf 文件中加入read_only=1 由 monitor 控制来控制 writer 和 read,root 用户和复制用户不受 read_only 参数的影响。