一,mysql-mha环境准备
1.1 实验环境:
主机名IP地址(NAT)描述
mysql-db01
eth0:192.168.0.51
系统:CentOS6.5(6.x都可以) 安装:mysql5.6
mysql-db02
eth0:192.168.0.52
系统:CentOS6.5(6.x都可以) 安装:mysql5.6
mysql-db03
eth0:192.168.0.53
系统:CentOS6.5(6.x都可以) 安装:mysql5.6
1.2 软件包
1) mha管理节点安装包:
mha4mysql-manager-0.56-0.el6.noarch.rpm
mha4mysql-manager-0.56.tar.gz
2) mha node节点安装包:
mha4mysql-node-0.56-0.el6.noarch.rpm
mha4mysql-node-0.56.tar.gz
3) mysql中间件:
Atlas-2.2.1.el6.x86_64.rpm
4) mysql源码安装包
mysql-5.6.17-linux-glibc2.5-x86_64.tar
1.3 主机名映射
1.4 关闭selinux和iptables
二,简介
2.1软件简介
MHA(Master High Availability)目前在MySQL高可用方面是一个相对成熟的解决方案,是一套优秀的作为MySQL高可用性环境下故障切换和主从提升的高可用软件。在MySQL故障切换过程中,MHA能做到0~30秒之内自动完成数据库的故障切换操作,并且在进行故障切换过程中,MHA能最大程度上保证数据库的一致性,以达到真正意义上的高可用。
MHA由两部分组成:MHA Manager(管理节点)和MHA Node(数据节点)。MHA Manager可以独立部署在一台独立的机器上管理多个Master-Slave集群,也可以部署在一台Slave上。当Master出现故障时,它可以自动将最新数据的Slave提升为新的Master,然后将所有其他的Slave重新指向新的Master。整个故障转移过程对应程序是完全透明的。
2.2 工作流程
从宕机崩溃的master保存二进制日志事件(binlog events);
识别含有最新更新的slave;
应用差异的中继日志(relay log)到其他的slave;
应用从master保存的二进制日志事件(binlog events);
提升一个slave为新的master;
使其他的slave连接新的master进行复制;
2.3 MHA架构图
2.5 MHA工具介绍
MHA软件由两部分组成,Manager工具包和Node工具包,具体的说明如下:
1 #Manager工具包主要包括以下几个工具:2 masterha_check_ssh #检查MHA的SSH配置状况3 masterha_check_repl #检查MySQL复制状况4 masterha_check_status #检测当前MHA运行状态5 masterha_master_monitor #检测master是否宕机6 masterha_manger #启动MHA7 masterha_master_switch #控制故障转移(自动或者手动)8 masterha_conf_host #添加或删除配置的server信息9 masterha_secondary_check #试图建立TCP连接从远程服务器10 masterha_stop #停止MHA11 #Node工具包主要包括以下几个工具:12 save_binary_logs #保存和复制master的二进制日志13 apply_diff_relay_logs #识别差异的中继日志事件14 filter_mysqlbinlog #去除不必要的ROLLBACK事件15 purge_relay_logs #清除中继日志
三,mysql环境准备
3.1安装mysql
3.2 安装(3台都装)
1 [root@zhengweiqiang ~]# yum -y install ncurses-devel2 [root@zhengweiqiang ~]# yum -y install libaio3 [root@zhengweiqiang ~]# tar xf mysql-5.6.17-linux-glibc2.5-x86_64.tar.gz -C /usr/local/
4 [root@zhengweiqiang ~]# ln -s /usr/local/mysql-5.6.17-linux-glibc2.5-x86_64 /usr/local/mysql5 [root@zhengweiqiang ~]# useradd mysql -s /sbin/nologin -M6 [root@zhengweiqiang~]# /usr/local/mysql/scripts/mysql_install_db --user=mysql --basedir=/usr/local/mysql --datadir=/usr/local/mysql/data/
7 [root@zhengweiqiang ~]# /bin/cp /usr/local/mysql/support-files/my-default.cnf /etc/my.cnf8 [root@zhengweiqiang ~]# /bin/cp /usr/local/mysql/support-files/mysql.server /etc/init.d/mysqld9 [root@zhengweiqiang ~]# ln -s /usr/local/mysql/bin/*/usr/local/bin/10 [root@zhengweiqiang~]# which mysqladmin11 /usr/local/bin/mysqladmin
3.2.2 配置密码
mysqladmin -uroot password '123123'
四,配置基于GTID的主从复制
4.1 先决条件
主库和从库都要开启binlog
主库和从库server-id不同
要有主从复制用户.
4.2 主库操作(mysql-db01)
修改配置文件
重启
4.2.2 登陆MySQL删除不必要的用户并创建主从复制用户
创建主从复制用户
4.3 从库操作(mysql-db02和mysql-db03)
1 #修改mysql-db02配置文件(和mysql-db01配置文件一致)2 #只需要修改server-id =5选项3 [root@mysql-db02 ~]# cat /etc/my.cnf4 [client]5 socket = /usr/local/mysql/data/mysql.sock6 [mysqld]7 lower_case_table_names = 1
8 default-storage-engine =InnoDB9 port = 3306
10 datadir = /usr/local/mysql/data11 character-set-server =utf812 socket = /usr/local/mysql/data/mysql.sock13 log_bin = mysql-bin #从binlog也要打开14 server_id = 5#仅需修改此项15 innodb_buffer_pool_size =200M16 slave-parallel-workers = 8
17 thread_cache_size = 600
18 back_log = 600
19 slave_net_timeout = 60
20 max_binlog_size =512M21 key_buffer_size =8M22 query_cache_size =64M23 join_buffer_size =2M24 sort_buffer_size =2M25 query_cache_type = 1
26 thread_stack =192K27 [root@mysql-db02 ~]# /etc/init.d/mysqld restart #重启mysql28 Shutting down MySQL.. SUCCESS!
29 Starting MySQL. SUCCESS!
30 #修改mysql-db03配置文件(和mysql-db01配置文件一致)31 #只需要修改server-id =10选项32 [root@mysql-db03 ~]# cat /etc/my.cnf33 [client]34 socket = /usr/local/mysql/data/mysql.sock35 [mysqld]36 lower_case_table_names = 1
37 default-storage-engine =InnoDB38 port = 3306
39 datadir = /usr/local/mysql/data40 character-set-server =utf841 socket = /usr/local/mysql/data/mysql.sock42 log_bin = mysql-bin #从binlog也要打开43 server_id = 10#只需修改此项44 innodb_buffer_pool_size =200M45 slave-parallel-workers = 8
46 thread_cache_size = 600
47 back_log = 600
48 slave_net_timeout = 60
49 max_binlog_size =512M50 key_buffer_size =8M51 query_cache_size =64M52 join_buffer_size =2M53 sort_buffer_size =2M54 query_cache_type = 1
55 thread_stack =192K56 [root@mysql-db03 ~]# /etc/init.d/mysqld restart #重启mysql57 Shutting down MySQL.. SUCCESS!
58 Starting MySQL. SUCCESS!
特别提示:
在以往如果是基于binlog日志的主从复制,则必须要记住主库的master状态信息。
4.4开启GTID
mysql-db01,mysql-db02,mysql-db03都需要加入上图的上行代码
4.5从库开启
配置主从复制
mysql-db01,mysql-db02,mysql-db03都需要加入上图的上行代码
从库开启
4.6 从库设置临时禁制mysql删除relay log日志功能
永久禁止Mysql删除relay log 日志功能
4.7 什么是GTID
GTID(Global Transaction)全局事务标识符:是一个唯一的标识符,它创建并与源服务器(主)上提交的每个事务相关联。此标识符不仅对其发起的服务器是唯一的,而且在给定复制设置中的所有服务器上都是唯一的。所有交易和所有GTID之间都有1对1的映射。
GTID实际上是由UUID+TID组成的。其中UUID是一个MySQL实例的唯一标识。TID代表了该实例上已经提交的事务数量,并且随着事务提交单调递增。
下面是一个GTID的具体形式:3E11FA47-71CA-11E1-9E33-C80AA9429562:23
4.8 GTID的新特性
(1)支持多线程复制:事实上是针对每个database开启相应的独立线程,即每个库有一个单独的(sql thread)
(2)支持启用GTID,在配置主从复制,传统的方式里,你需要找到binlog和POS点,然后change master to 指向。在mysql5.6里,无须再知道binlog和POS点,只需要知道master的IP/端口/账号密码即可,因为同步复制是自动的,MySQL通过内部机制GTID自动找点同步。
(3)基于Row复制只保存改变的列,大大节省磁盘空间,网络,内存等
(4)支持把Master和Slave的相关信息记录在Table中;原来是记录在文件里,现在则记录在表里,增强可用性
(5)支持延迟复制
4.9 开启方法
#mysql配置文件:
[mysqld]
gtid_mode=ON
enforce_gtid_consistency
#查看
show globalvariables like ‘%gtid%’;
五,部署MHA
5.1 环境准备(所有节点mysql-db01,mysql-db02,mysql-db03)
#光盘安装依赖包
[root@mysql-db01 ~]# yum -y install perl-DBD-MySQL
#安装mha4mysql-node-0.56-0.el6.noarch.rpm
[root@mysql-db01 rpm]# rpm -ivh mha4mysql-node-0.56-0.el6.noarch.rpm
Preparing... ########################################### [100%]1:mha4mysql-node ########################################### [100%]
[root@mysql-db01 ~]# mysql -uroot -p123123
mysql> grant all privileges on *.* to mha@'192.168.0.%' identified by '123123';
Query OK,0 rows affected (0.00sec)
mysql> select user,host from mysql.user where user='mha';+------+-------------+
| user | host |
+------+-------------+
| mha | 192.168.0.% |#主库上创建从库会自动复制+------+-------------+
1 row in set (0.00sec)
#特别提示:3台MySQL都需要安装mha4mysql-node-0.56-0.el6.noarch.rpm部署管理节点(mha-manager)在mysql-db03上部署管理节点
#使用阿里云源+epel源
wget-O /etc/yum.repos.d/CentOS-Base.repo http://mirrors.aliyun.com/repo/Centos-6.repo
wget -O /etc/yum.repos.d/epel-6.repo http://mirrors.aliyun.com/repo/epel-6.repo
5.2部署管理节点(mha-manager)
在mysql-db03上部署管理节点
1 #安装manager依赖包(需要公网源)2 [root@zhengweiqiang ~]# yum -y install perl-Config-Tiny epel-release perl-Log-Dispatch perl-Parallel-ForkManager perl-Time-HiRes
5.2.1编辑配置文件
配置文件
[server default]
manager_log=/var/log/mha/mha1/manager #manager管理日志存放路径
manager_workdir=/var/log/mha/mha1 #manager管理日志的目录路径
master_binlog_dir=/usr/local/mysql/data #binlog日志的存放路径
user=mha #管理账户
password=123123#管理账户密码
ping_interval=2#存活检查的间隔时间
repl_user=rep #主从复制的授权账户
repl_password=123123#主从复制的授权账户密码
ssh_user=root #用于ssh连接的账户
[server1]
hostname=192.168.0.51port=3306[server2]
#candidate_master=1#此条暂时注释掉
#check_repl_delay=0#此条暂时注释掉
hostname=192.168.0.52port=3306[server3]
hostname=192.168.0.53port=3306#**特别提示:**#以上配置文件内容里每行的最后不要留有空格,因此,不能复制的呦
特别说明:
参数:candidate_master=1
解释:设置为候选master,如果设置该参数以后,发生主从切换以后会将此从库提升为主库,即使这个主库不是集群中事件最新的slave
参数:check_repl_delay=0
解释:默认情况下如果一个slave落后master 100M的relay logs
的话,MHA将不会选择该slave作为一个新的master,因为对于这个slave的恢复需要花费很长时间,通过设置check_repl_delay=0,MHA触发切换在选择一个新的master的时候将会忽略复制延时,这个参数对于设置了candidate_master=1的主机非常有用,因为这个候选主在切换的过程中一定是新的master
5.3配置ssh信任(所有节点mysql-db01,mysql-db02,mysql-db03)
1 #创建密钥对2 [root@zhengweiqiang ~]# ssh-keygen -t dsa -P "" -f ~/.ssh/id_dsa >/dev/null 2>&1
3 #发送mysql-db03公钥,包括自己4 [root@zhengweiqiang ~]# ssh-copy-id -i /root/.ssh/id_dsa.pub root@192.168.200.128
5 [root@zhengweiqiang ~]# ssh-copy-id -i /root/.ssh/id_dsa.pub root@192.168.200.129
6 [root@zhengweiqiang ~]# ssh-copy-id -i /root/.ssh/id_dsa.pub root@192.168.200.130
7 #发送mysql-db02公钥,包括自己8 [root@zhengweiqiang ~]# ssh-copy-id -i /root/.ssh/id_dsa.pub root@192.168.200.128
9 [root@zhengweiqiang ~]# ssh-copy-id -i /root/.ssh/id_dsa.pub root@192.168.200.129
10 [root@zhengweiqiang ~]# ssh-copy-id -i /root/.ssh/id_dsa.pub root@192.168.200130
11 #发送mysql-db01公钥,包括自己12 [root@zhengweiqiang ~]# ssh-copy-id -i /root/.ssh/id_dsa.pub root@192.168.200.128
13 [root@zhengweiqiang ~]# ssh-copy-id -i /root/.ssh/id_dsa.pub root@192.168.200.129
14 [root@zhengweiqiang ~]# ssh-copy-id -i /root/.ssh/id_dsa.pub root@192.168.200.130
5.4 启动测试
测试SSH
1 Tue Sep 5 03:01:38 2017 - [warning] Global configuration file /etc/masterha_default.cnf not found. Skipping.2 Tue Sep 5 03:01:38 2017 - [info] Reading application default configuration from /etc/mha/mha1.cnf..3 Tue Sep 5 03:01:38 2017 - [info] Reading server configuration from /etc/mha/mha1.cnf..4 Tue Sep 5 03:01:38 2017 -[info] Starting SSH connection tests..5 ..中间省略若干行..6 Tue Sep 5 03:01:40 2017 - [debug] Connecting via SSH from root@192.168.0.53(192.168.0.53:22) to root@192.168.0.52(192.168.0.52:22)..7 Tue Sep 5 03:01:40 2017 -[debug] ok.8 Tue Sep 5 03:01:40 2017 - [info] All SSH connection tests passed successfully. #出现这个就表示成功
测试主从复制
1 [root@zhengweiqiang ~]# masterha_check_repl --conf=/etc/mha/mha1.2 cnfMon Dec 17 20:57:16 2018 - [warning] Global configuration file /e3 tc/masterha_default.cnf not found. Skipping.Mon Dec 17 20:57:16 2018 - [info] Reading application defaultcon4 figuration from /etc/mha/mha1.cnf..Mon Dec 17 20:57:16 2018 -[info] Reading server configuration fr5 om /etc/mha/mha1.cnf..Mon Dec 17 20:57:16 2018 - [info] MHA::MasterMonitor version 0.56
6 .Mon Dec 17 20:57:16 2018 - [info] GTID failover mode = 1
7 Mon Dec 17 20:57:16 2018 -[info] Dead Servers:8 Mon Dec 17 20:57:16 2018 -[info] Alive Servers:9 Mon Dec 17 20:57:16 2018 - [info] 192.168.200.128(192.168.200.1
10 28:3306)Mon Dec 17 20:57:16 2018 - [info] 192.168.200.129(192.168.200.1
11 29:3306)Mon Dec 17 20:57:16 2018 - [info] 192.168.200.130(192.168.200.1
12 30:3306)Mon Dec 17 20:57:16 2018 -[info] Alive Slaves:13 Mon Dec 17 20:57:16 2018 - [info] 192.168.200.129(192.168.200.1
14 29:3306) Version=5.6.17-log (oldest major version between slaves) log-bin:enabledMon Dec 17 20:57:16 2018 -[info] GTID ON15 Mon Dec 17 20:57:16 2018 - [info] Replicating from 192.168.20
16 0.128(192.168.200.128:3306)Mon Dec 17 20:57:16 2018 - [info] 192.168.200.130(192.168.200.1
17 30:3306) Version=5.6.17-log (oldest major version between slaves) log-bin:enabledMon Dec 17 20:57:16 2018 -[info] GTID ON18 Mon Dec 17 20:57:16 2018 - [info] Replicating from 192.168.20
19 0.128(192.168.200.128:3306)Mon Dec 17 20:57:16 2018 - [info] Current Alive Master: 192.168.2
20 00.128(192.168.200.128:3306)Mon Dec 17 20:57:16 2018 -[info] Checking slave configurations..21 Mon Dec 17 20:57:16 2018 - [info] read_only=1 is not seton slav22 e 192.168.200.129(192.168.200.129:3306).Mon Dec 17 20:57:16 2018 - [info] read_only=1 is not seton slav23 e 192.168.200.130(192.168.200.130:3306).Mon Dec 17 20:57:16 2018 -[info] Checking replication filtering24 settings..Mon Dec 17 20:57:16 2018 - [info] binlog_do_db=, binlog_ignore_25 db= Mon Dec 17 20:57:16 2018 -[info] Replication filtering check ok26 .Mon Dec 17 20:57:16 2018 - [info] GTID (with auto-pos) issupport27 ed. Skipping all SSH and Node package checking.Mon Dec 17 20:57:16 2018 -[info] Checking SSH publickey authenti28 cation settings on the current master..Mon Dec 17 20:57:16 2018 - [info] HealthCheck: SSH to 192.168.200
29 .128 is reachable.Mon Dec 17 20:57:16 2018 -[info]30 192.168.200.128(192.168.200.128:3306) (current master)31 +--192.168.200.129(192.168.200.129:3306)32 +--192.168.200.130(192.168.200.130:3306)33
34 Mon Dec 17 20:57:16 2018 -[info] Checking replication health on35 192.168.200.129..Mon Dec 17 20:57:16 2018 -[info] ok.36 Mon Dec 17 20:57:16 2018 -[info] Checking replication health on37 192.168.200.130..Mon Dec 17 20:57:16 2018 -[info] ok.38 Mon Dec 17 20:57:16 2018 - [warning] master_ip_failover_script is
39 not defined.Mon Dec 17 20:57:16 2018 - [warning] shutdown_script isnot defin40 ed.Mon Dec 17 20:57:16 2018 - [info] Got exit code 0(Not master dea41 d).42 MySQL Replication Health is OK.
5.5 启动MHA