Mysql 集群技术

最新推荐文章于 2024-08-26 17:57:40 发布

皇吾大盾士

最新推荐文章于 2024-08-26 17:57:40 发布

阅读量758

点赞数 8

文章标签： adb 运维 mysql

本文链接：https://blog.csdn.net/m0_63255850/article/details/141436270

版权

-- Table structure for table userlist

五 mysql-router（mysql路由）

一 Mysql 在服务器中的部署方法

在企业中90%的服务器操作系统均为Linux 在企业中对于Mysql的安装通常用源码编译的方式来进行官网：http://www.mysql.com

1.1 在Linux下部署mysql

1.1.1 安装依赖性：

[root@mysql-node10 ~]# dnf install cmake gcc-c++ openssl-devel \
ncurses-devel.x86_64 libtirpc-devel-1.3.3-8.el9_4.x86_64.rpm rpcgen.x86_64

1.1.2 下载并解压源码包

[root@mysql-node10 ~]# tar zxf mysql-boost-5.7.44.tar.gz
[root@mysql-node10 ~]# cd /root/mysql-5.7.44

1.1.3 源码编译安装mysql

[root@mysql-node10 mysql-5.7.44]# cmake \
-DCMAKE_INSTALL_PREFIX=/usr/local/mysql \ #指定安装路径
-DMYSQL_DATADIR=/data/mysql \ #指定数据目录
-DMYSQL_UNIX_ADDR=/data/mysql/mysql.sock \ #指定套接字文件
-DWITH_INNOBASE_STORAGE_ENGINE=1 \ #指定启用INNODB存储引擎，默认用myisam
-DWITH_EXTRA_CHARSETS=all \ #扩展字符集
-DDEFAULT_CHARSET=utf8mb4 \ #指定默认字符集
-DDEFAULT_COLLATION=utf8mb4_unicode_ci \ #指定默认校验字符集
-DWITH_BOOST=/root/mysql-5.7.44/boost/boost_1_59_0/ #指定c++库依赖
[root@mysql-node10 mysql-5.7.44]# make -j2 #-j2 表示有几个核心就跑几个进程
[root@mysql-node10 mysql-5.7.44# make install

当cmake出错后如果想重新检测，删除 mysql-5.7.44 中 CMakeCache.txt即可

1.1.4 部署mysql

建立mysql用户和目录并增加权限

#生成启动脚本
[root@mysql-node1 mysql]# cd support-files/
[root@mysql-node1 support-files]# cp mysql.server /etc/init.d/mysqld

#修改环境变量
[root@mysql-node1 support-files]# vim ~/.bash_profile
[root@mysql-node1 ~]# source ~/.bash_profile

#生成配置文件
[root@mysql-node1 support-files]# vim /etc/my.cnf

#数据库初始化建立mysql基本数据
[root@mysql-node1 ~]# mysqld --initialize --user=mysql     #记录生成后的密码

[root@mysql-node1 ~]# /etc/init.d/mysqld start

[root@mysql-node1 ~]# chkconfig mysqld on

#数据库安全初始化
[root@mysql-node1 ~]# mysql_secure_installation   根据自己的需求选则是否要重置密码或开启某些功能

测试：

mysql-node2 同理

二 mysql的组从复制

2.1 配置mastesr

[root@mysql-node1 ~]# vim /etc/my.cnf

[root@mysql-node1 ~]# /etc/init.d/mysqld restart

#进入数据库配置用户权限

[root@mysql-node1 ~]# mysql -uroot -p

[root@mysql-node1 ~]# cd /data/mysql/
[root@mysql-node1 mysql]# mysqlbinlog mysql-bin.000001 -vv    ##查看二进制日志

2.2 配置salve

[root@mysql-node2 ~]# vim /etc/my.cnf

[root@mysql-node2 ~]# /etc/init.d/mysqld restart
[root@mysql-node2 ~]# mysql -uroot -p

测试

在slave中查看数据是否有同步过来

2.3 当有数据时添加slave2

[root@mysql-node3 ~]# vim /etc/my.cnf

#从master节点备份数据

[root@mysql-node1 ~]# mysqldump -uroot -p123456 lee > lee.sql

生产环境中备份时需要锁表，保证备份前后的数据一致 mysql> FLUSH TABLES WITH READ LOCK; 备份后再解锁 mysql> UNLOCK TABLES; mysqldump命令备份的数据文件，在还原时先DROP TABLE，需要合并数据时需要删除此语句

-- Table structure for table `userlist`

DROP TABLE IF EXISTS userlist; #需要合并数据时需要删除此语句 /*!40101 SET @saved_cs_client = @@character_set_client /; /!40101 SET character_set_client = utf8 */;

#利用master节点中备份出来的lee.sql在slave2中拉平数据
[root@mysql-node3 ~]# mysql -uroot -p123456 -e "create database lee;"
[root@mysql-node3 ~]# mysql -uroot -p123456 <lee.sql
[root@mysql-node3 ~]# mysql -uroot -p123456 -e "select * from lee.userlist;"

#配置slave2的slave功能
\#在master中查询日志pos mysql -uroot -plee -e "SHOW MASTER STATUS;"
[root@mysql-node3 ~]# mysql -p

测试：

2.4 延迟复制

延迟复制时用来控制sql线程的，和i/o线程无关这个延迟复制不是i/o线程过段时间来复制，i/o是正常工作的是日志已经保存在slave端了，那个sql要等多久进行回放

#在slave端
mysql> STOP SLAVE SQL_THREAD;
mysql> CHANGE MASTER TO MASTER_DELAY=60;
mysql> START SLAVE SQL_THREAD;
mysql> SHOW SLAVE STATUS\G;
             Master_Server_Id: 1
                 Master_UUID: db2d8c92-4dc2-11ef-b6b0-000c299355ea
             Master_Info_File: /data/mysql/master.info
                   SQL_Delay: 60 ##延迟效果
         SQL_Remaining_Delay: NULL
     Slave_SQL_Running_State: Slave has read all relay log; waiting for more 
updates
           Master_Retry_Count: 86400

测试：在master中写入数据后过了延迟时间才能被查询到

2.5 慢查询日志

慢查询，顾名思义，执行很慢的查询当执行SQL超过long_query_time参数设定的时间阈值（默认10s）时，就被认为是慢查询，这个 SQL语句就是需要优化的

慢查询被记录在慢查询日志里慢查询日志默认是不开启的如果需要优化SQL语句，就可以开启这个功能，它可以让你很容易地知道哪些语句是需要优化的。

mysql> SHOW variables like "slow%";

开启慢查询日志

mysql> SET GLOBAL slow_query_log=ON;
mysql> SET GLOBAL slow_query_log=ON;
mysql> SHOW VARIABLES like "long%";

##慢查询日志开启
mysql> SHOW VARIABLES like "slow%";

[root@mysql-node1 ~]# cat /data/mysql/mysql-node1-slow.log     #慢查询日志

测试慢查询

2.6 mysql的并行复制

查看slave中的线程信息

默认情况下slave中使用的是sql单线程回放在master中时多用户读写，如果使用sql单线程回放那么会造成组从延迟严重开启MySQL的多线程回放可以解决上述问题

在slaves中设定

[root@mysql-node2 ~]# vim /etc/my.cnf
[mysqld]
datadir=/data/mysql
socket=/data/mysql/mysql.sock
server-id=2
gtid_mode=ON
enforce-gtid-consistency=ON
slave-parallel-type=LOGICAL_CLOCK #基于组提交，
slave-parallel-workers=16 #开启线程数量
master_info_repository=TABLE #master信息在表中记录，默认记录
在/data/mysql//master.info
relay_log_info_repository=TABLE #回放日志信息在表中记录，默认记录
在/data/mysql/relay-log.info
relay_log_recovery=ON #日志回放恢复功能开启

[root@mysql-node2 mysql]# /etc/init.d/mysqld restart
Shutting down MySQL.. SUCCESS! 
Starting MySQL. SUCCESS!

此时sql线程转化为协调线程，16个worker负责处理sql协调线程发送过来的处理请求

MySQL 组提交（Group commit）是一个性能优化特性，它允许在一个事务日志同步操作中将多个事务的日志记录一起写入。这样做可以减少磁盘I/O的次数，从而提高数据库的整体性能。

2.7 原理刨析

三个线程

实际上主从同步的原理就是基于 binlog 进行数据同步的。在主从复制过程中，会基于3 个线程来操作，一个主库线程，两个从库线程。二进制日志转储线程（Binlog dump thread）是一个主库线程。当从库线程连接的时候，主库可以将二进制日志发送给从库，当主库读取事件（Event）的时候，会在 Binlog 上加锁，读取完成之后，再将锁释放掉。从库 I/O 线程会连接到主库，向主库发送请求更新 Binlog。这时从库的 I/O 线程就可以读取到主库的二进制日志转储线程发送的 Binlog 更新部分，并且拷贝到本地的中继日志（Relay log）。从库 SQL 线程会读取从库中的中继日志，并且执行日志中的事件，将从库中的数据与主库保持同步。复制三步骤步骤1：Master将写操作记录到二进制日志（binlog）。

步骤2：Slave将Master的binary log events拷贝到它的中继日志（relay log）；步骤3：Slave重做中继日志中的事件，将改变应用到自己的数据库中。 MySQL复制是异步的且串行化的，而且重启后从接入点开始复制。

具体操作 1.slaves端中设置了master端的ip，用户，日志，和日志的Position，通过这些信息取得master的认证及信息 2.master端在设定好binlog启动后会开启binlog dump的线程 3.master端的binlog dump把二进制的更新发送到slave端的 4.slave端开启两个线程，一个是I/O线程，一个是sql线程， i/o线程用于接收master端的二进制日志，此线程会在本地打开relaylog中继日志，并且保存到本地磁盘 sql线程读取本地relog中继日志进行回放 5.什么时候我们需要多个slave？当读取的而操作远远高与写操作时。我们采用一主多从架构数据库外层接入负载均衡层并搭配高可用机制

2.8 架构缺陷

主从架构采用的是异步机制 master更新完成后直接发送二进制日志到slave，但是slaves是否真正保存了数据master端不会检测 master端直接保存二进制日志到磁盘当master端到slave端的网络出现问题时或者master端直接挂掉，二进制日志可能根本没有到达slave master出现问题slave端接管master，这个过程中数据就丢失了这样的问题出现就无法达到数据的强一致性，零数据丢失

三半同步模式

3.1半同步模式原理

.用户线程写入完成后master中的dump会把日志推送到slave端 2.slave中的io线程接收后保存到relaylog中继日志 3.保存完成后slave向master端返回ack 4.在未接受到slave的ack时master端时不做提交的，一直处于等待当收到ack后提交到存储引擎 5.在5.6版本中用到的时after_commit模式，after_commit模式时先提交在等待ack返回后输出ok

3.2 gtid模式

当为启用gtid时我们要考虑的问题在master端的写入时多用户读写，在slave端的复制时单线程日志回放，所以slave端一定会延迟与 master端这种延迟在slave端的延迟可能会不一致，当master挂掉后slave接管，一般会挑选一个和master延迟日志最接近的充当新的master 那么为接管master的主机继续充当slave角色并会指向到新的master上，作为其slave 这时候按照之前的配置我们需要知道新的master上的pos的id，但是我们无法确定新的master和slave之间差多少

当激活GITD之后当master出现问题后，slave2和master的数据最接近，会被作为新的master slave1指向新的master，但是他不会去检测新的master的pos id，只需要继续读取自己gtid_next即可

设置gtid

[root@mysql-node1 ~]# vim /etc/my.cnf
[root@mysql-node1 ~]# /etc/init.d/mysqld restart

[root@mysql-node2 mysql]# vim /etc/my.cnf
[root@mysql-node2 mysql]# /etc/init.d/mysqld restart

[root@mysql-node3 ~]# vim /etc/my.cnf
[root@mysql-node3 ~]# /etc/init.d/mysqld restart

#停止slave端
[root@mysql-node2 ~]# mysql -p
mysql> stop slave;
Query OK, 0 rows affected (0.00 sec)
[root@mysql-node3 ~]# mysql -p
mysql> stop slave;
Query OK, 0 rows affected (0.01 sec)

#开启slave端的gtid 两个都要开启

mysql> CHANGE MASTER TO MASTER_HOST='172.25.254.10', MASTER_USER='repl', 
MASTER_PASSWORD='lee', MASTER_AUTO_POSITION=1;
mysql> start slave;
mysql> show slave status\G;

3.3.启用半同步模式

在master端配置启用半同步模式

[root@mysql-node1 ~]# vim /etc/my.cnf

#安装半同步插件
mysql> INSTALL PLUGIN rpl_semi_sync_master SONAME 'semisync_master.so';

#查看插件情况
mysql> SELECT PLUGIN_NAME, PLUGIN_STATUS
   -> FROM INFORMATION_SCHEMA.PLUGINS
   -> WHERE PLUGIN_NAME LIKE '%semi%';

#打开半同步功能
mysql> SET GLOBAL rpl_semi_sync_master_enabled = 1;

#查看半同步功能状态
mysql> SHOW VARIABLES LIKE 'rpl_semi_sync%';

在slave端开启半同步功能

[root@mysql-node2 mysql]# vim /etc/my.cnf

mysql> INSTALL PLUGIN rpl_semi_sync_slave SONAME 'semisync_slave.so';
Query OK, 0 rows affected (0.01 sec)

mysql> SET GLOBAL rpl_semi_sync_slave_enabled =1;
Query OK, 0 rows affected (0.00 sec)

mysql> STOP SLAVE IO_THREAD; #重启io线程，半同步才能生效
Query OK, 0 rows affected (0.00 sec)

mysql> START SLAVE IO_THREAD; ##重启io线程，半同步才能生效
Query OK, 0 rows affected (0.00 sec)

mysql> SHOW VARIABLES LIKE 'rpl_semi_sync%';

mysql> SHOW STATUS LIKE 'Rpl_semi_sync%';

3.4.测试

在master端写入数据

模拟故障：

#在slave端
[root@mysql-node2 ~]# mysql -p123456
mysql> STOP SLAVE IO_THREAD;
Query OK, 0 rows affected (0.00 sec)

[root@mysql-node3 ~]# mysql -p123456
mysql> STOP SLAVE IO_THREAD;
Query OK, 0 rows affected (0.00 sec)

四 mysql高可用之组复制 (MGR)

MySQL Group Replication(简称 MGR )是 MySQL 官方于 2016 年 12 月推出的一个全新的高可用与高扩展的解决方案组复制是 MySQL 5.7.17 版本出现的新特性，它提供了高可用、高扩展、高可靠的 MySQL 集群服务 MySQL 组复制分单主模式和多主模式，传统的mysql复制技术仅解决了数据同步的问题， MGR 对属于同一组的服务器自动进行协调。对于要提交的事务，组成员必须就全局事务序列中给定事务的顺序达成一致提交或回滚事务由每个服务器单独完成，但所有服务器都必须做出相同的决定如果存在网络分区，导致成员无法达成事先定义的分割策略，则在解决此问题之前系统不会继续进行，这是一种内置的自动裂脑保护机制 MGR由组通信系统( Group Communication System ，GCS ) 协议支持该系统提供故障检测机制、组成员服务以及安全且有序的消息传递

4.1 组复制流程

首先我们将多个节点共同组成一个复制组，在执行读写（RW）事务的时候，需要通过一致性协议层（Consensus 层）的同意，也就是读写事务想要进行提交，必须要经过组里“大多数人”（对应 Node 节点）的同意，大多数指的是同意的节点数量需要大于（N/2+1），这样才可以进行提交，而不是原发起方一个说了算。而针对只读（RO）事务则不需要经过组内同意，直接提交即可

节点数量不能超过9台

4.2 组复制单主和多主模式

single-primary mode(单写或单主模式) 单写模式 group 内只有一台节点可写可读，其他节点只可以读。当主服务器失败时，会自动选择新的主服务器，

multi-primary mode(多写或多主模式) 组内的所有机器都是 primary 节点，同时可以进行读写操作，并且数据是最终一致的。

4.3.实现mysql组复制

为了避免出错，在所有节点中从新生成数据库数据

#在mysql-node1中
[root@mysql-node1 ~]# rm -fr /data/mysql/
[root@mysql-node1 ~]# mkdir /data/mysql
[root@mysql-node1 ~]# chown mysql.mysql -R /data/mysql

[root@mysql-node1 ~]# vim /etc/my.cnf
[mysqld]
datadir=/data/mysql
socket=/data/mysql/mysql.sock
symbolic-links=0
server-id=1 #配置server唯一标识号
disabled_storage_engines="MyISAM,BLACKHOLE,FEDERATED,ARCHIVE,MEMORY" #禁用指定存储引擎
gtid_mode=ON #启用全局事件标识
enforce_gtid_consistency=ON #强制gtid一致
master_info_repository=TABLE #复制事件数据到表中而不记录在数据目录中
relay_log_info_repository=TABLE
binlog_checksum=NONE #禁止对二进制日志校验
log_slave_updates=ON #打开数据库中继，
 #当slave中sql线程读取日志后也会写入到自己的binlog中
log_bin=binlog #重新指定log名称 
binlog_format=ROW #使用行日志格式 
plugin_load_add='group_replication.so' #加载组复制插件
transaction_write_set_extraction=XXHASH64 #把每个事件编码为加密散列
group_replication_group_name="aaaaaaaa-aaaa-aaaa-aaaa-aaaaaaaaaaaa" #通知插件正式加入#或创建的组名#名称uuid格式
group_replication_start_on_boot=off #在server启动时不自动启动组复制
group_replication_local_address="172.25.254.10:33061" #指定插件接受其他成员的信息端口
group_replication_group_seeds="172.25.254.10:33061,172.25.254.20:33061，172.25.254.30:33061"   #本地地址允许访问成员列表
group_replication_ip_whitelist="172.25.254.0/24,127.0.0.1/8" #主机白名单
group_replication_bootstrap_group=off #不随系统自启而启动
group_replication_single_primary_mode=OFF #使用多主模式
group_replication_enforce_update_everywhere_checks=ON #组同步中有任何改变检测更新
group_replication_allow_local_disjoint_gtids_join=1 #放弃自己信息以master事件为主

[root@mysql-node1 ~]# mysqld --user=mysql --initialize
[root@mysql-node1 ~]# /etc/init.d/mysqld start
[root@mysql-node1 ~]# mysql -uroot -p初始化后生成的密码 -e "alter user 
root@localhost identified by 'lee';"  #可以更改密码方便操作

#配置sql
mysql> SET SQL_LOG_BIN=0;
Query OK, 0 rows affected (0.00 sec)

mysql> CREATE USER rpl_user@'%' IDENTIFIED BY 'lee';
Query OK, 0 rows affected (0.00 sec)

mysql> GRANT REPLICATION SLAVE ON *.* TO rpl_user@'%';
Query OK, 0 rows affected (0.00 sec)

mysql> FLUSH PRIVILEGES;
Query OK, 0 rows affected (0.00 sec)

mysql>  SET SQL_LOG_BIN=1;
Query OK, 0 rows affected (0.00 sec)

mysql> CHANGE MASTER TO MASTER_USER='rpl_user', MASTER_PASSWORD='lee' FOR CHANNEL                                                                                                                              
    -> 'group_replication_recovery';
Query OK, 0 rows affected, 2 warnings (0.01 sec)

mysql> SET GLOBAL group_replication_bootstrap_group=ON;
Query OK, 0 rows affected (0.00 sec)

mysql> START GROUP_REPLICATION;
Query OK, 0 rows affected, 1 warning (2.05 sec)

mysql> SET GLOBAL group_replication_bootstrap_group=OFF;
Query OK, 0 rows affected (0.00 sec)

mysql> SELECT * FROM performance_schema.replication_group_members;

#做地址解析
[root@mysql-node1 ~]# vim /etc/hosts

#20与30主机同样配置，只需更改id与IP地址

20与30主机不需要mysql> SET GLOBAL group_replication_bootstrap_group=ON;这条命令

node3

测试：

#在mysql-node10中
[root@mysql-node1 ~]# mysql -p
mysql> CREATE DATABASE lee;
Query OK, 1 row affected (0.00 sec)
mysql> CREATE TABLE lee.userlist(
   -> username VARCHAR(10) PRIMARY KEY NOT NULL,
   -> password VARCHAR(50) NOT NULL
   -> );
Query OK, 0 rows affected (0.01 sec)
mysql> INSERT INTO lee.userlist VALUES ('user1','111');
Query OK, 1 row affected (0.00 sec)
mysql> SELECT * FROM lee.userlist;

#在mysql-node2中
[root@mysql-node2 ~]# mysql -p
mysql> INSERT INTO lee.userlist values ('user2','222');
Query OK, 1 row affected (0.00 sec)
mysql> select * from lee.userlist;

#mysql—node30中
[root@mysql-node3 ~]# mysql -p
mysql> INSERT INTO lee.userlist values ('user3','333');
Query OK, 1 row affected (0.00 sec)
mysql> select * from lee.userlist;

五 mysql-router（mysql路由）

MySQL Router 是一个对应用程序透明的InnoDB Cluster连接路由服务，提供负载均衡、应用连接故障转移和客户端路由。利用路由器的连接路由特性，用户可以编写应用程序来连接到路由器，并令路由器使用相应的路由策略来处理连接，使其连接到正确的MySQL数据库服务器

Mysql route的部署方式我们需要在所有的数据库主机之外再开一台主机mysql-router

#安装mysql-router
[root@mysql-node1 ~]# rpm -ivh mysql-router-community-8.4.0-1.el7.x86_64.rpm

#配置mysql-router
[root@mysql-node1 ~]# vim /etc/mysqlrouter/mysqlrouter.conf
[routing:ro]
bind_address = 0.0.0.0
bind_port = 7001
destinations = 172.25.254.10:3306,172.25.254.20:3306,172.25.254.30:3306
routing_strategy = round-robin
[routing:rw]
bind_address = 0.0.0.0
bind_port = 7002
destinations = 172.25.254.30:3306,172.25.254.20:3306,172.25.254.10:3306
routing_strategy = first-available

[root@mysql-node1 ~]# systemctl start mysqlrouter.service

测试：

#建立测试用户
mysql> CREATE USER lee@'%' IDENTIFIED BY 'lee';
mysql> GRANT ALL ON lee.* TO lee@'%';

#查看调度效果
[root@mysql-node1 & 2 & 3 ~]# watch -1 lsof -i :3306

[root@mysql-node1 ~]# mysql -ulee -plee -h 172.25.254.10 -P 7001

mysql router 并不能限制数据库的读写，访问分流

六 mysql高可用之MHA

6.1.MHA概述

为什么要用MHA？ Master的单点故障问题

什么是 MHA？ MHA（Master High Availability）是一套优秀的MySQL高可用环境下故障切换和主从复制的软件。 MHA 的出现就是解决MySQL 单点的问题。 MySQL故障切换过程中，MHA能做到0-30秒内自动完成故障切换操作。 MHA能在故障切换的过程中最大程度上保证数据的一致性，以达到真正意义上的高可用。

MHA 的组成 MHA由两部分组成:MHAManager (管理节点) MHA Node (数据库节点), MHA Manager 可以单独部署在一台独立的机器上管理多个master-slave集群，也可以部署在一台 slave 节点上。 MHA Manager 会定时探测集群中的 master 节点。当 master 出现故障时，它可以自动将最新数据的 slave 提升为新的 master，然后将所有其他的 slave 重新指向新的 master。

MHA 的特点自动故障切换过程中，MHA从宕机的主服务器上保存二进制日志，最大程度的保证数据不丢失使用半同步复制，可以大大降低数据丢失的风险，如果只有一个slave已经收到了最新的二进制日志，MHA可以将最新的二进制日志应用于其他所有的slave服务器上，因此可以保证所有节点的数据一致性目前MHA支持一主多从架构，最少三台服务，即一主两从

故障切换备选主库的算法 1．一般判断从库的是从（position/GTID）判断优劣，数据有差异，最接近于master的slave，成为备选主。 2．数据一致的情况下，按照配置文件顺序，选择备选主库。 3．设定有权重（candidate_master=1），按照权重强制指定备选主。（1）默认情况下如果一个slave落后master 100M的relay logs的话，即使有权重，也会

（2）如果check_repl_delay=0的话，即使落后很多日志，也强制选择其为备选主。

MHA工作原理目前MHA主要支持一主多从的架构，要搭建MHA,要求一个复制集群必须最少有3台数据库服务器，一主二从，即一台充当Master，台充当备用Master，另一台充当从库。 MHA Node 运行在每台 MySQL 服务器上 MHAManager 会定时探测集群中的master 节点当master 出现故障时，它可以自动将最新数据的slave 提升为新的master 然后将所有其他的slave 重新指向新的master，VIP自动漂移到新的master。整个故障转移过程对应用程序完全透明。

6.2 MHA部署实施

6.2.1 搭建主两从架构

[root@mysql-node1 ~]# /etc/init.d/mysqld stop
Shutting down MySQL.. SUCCESS!
[root@mysql-node1 ~]# rm -fr /data/mysql/*
[root@mysql-node1 ~]#  vim /etc/my.cnf

[root@mysql-node1 ~]# mysqld --user mysql --initialize
[root@mysql-node1 ~]# /etc/init.d/mysqld start
[root@mysql-node1 ~]# mysql_secure_installation

[root@mysql-node1 ~]# mysql -p

#在slave1和slave2中
[root@mysql-node2 & 3 ~]# /etc/init.d/mysqld stop
[root@mysql-node2 & 3 ~]# rm -fr /data/mysql/*
[root@mysql-node2 & 3 ~]# vim /etc/my.cnf

[root@mysql-node2 & 3 ~]# mysqld --user mysql --initialize
[root@mysql-node2 & 3 ~]# /etc/init.d/mysqld start
[root@mysql-node2 & 3 ~]# mysql_secure_installation
[root@mysql-node2 & 3 ~]# mysql -p

6.2.2安装MHA所需要的软件

[root@mysql-mha ~]# unzip MHA-7.zip
[root@mysql-mha MHA-7]# ls

[root@MHA MHA-7]# yum install *.rpm -y
[root@mysql-mha MHA-7]# scp mha4mysql-node-0.58-0.el7.centos.noarch.rpm 
root@172.25.254.10:/mnt
[root@mysql-mha MHA-7]# scp mha4mysql-node-0.58-0.el7.centos.noarch.rpm 
root@172.25.254.20:/mnt
[root@mysql-mha MHA-7]# scp mha4mysql-node-0.58-0.el7.centos.noarch.rpm 
root@172.25.254.30:/mnt

#在sql-node中
[root@mysql-node1 ~]# yum install /mnt/mha4mysql-node-0.58-
0.el7.centos.noarch.rpm -y
[root@mysql-node2 ~]# yum install /mnt/mha4mysql-node-0.58-
0.el7.centos.noarch.rpm -y
[root@mysql-node3 ~]# yum install /mnt/mha4mysql-node-0.58-
0.el7.centos.noarch.rpm -y

在软件中包含的工具包介绍 1.Manager工具包主要包括以下几个工具： masterha_check_ssh #检查MHA的SSH配置状况 masterha_check_repl #检查MySQL复制状况 masterha_manger #启动MHA masterha_check_status #检测当前MHA运行状态 masterha_master_monitor #检测master是否宕机 masterha_master_switch #控制故障转移（自动或者手动） masterha_conf_host #添加或删除配置的server信息

2.Node工具包（通常由masterHA主机直接调用，无需人为执行） save_binary_logs #保存和复制master的二进制日志 apply_diff_relay_logs #识别差异的中继日志事件并将其差异的事件应用于其他的slave

filter_mysqlbinlog #去除不必要的ROLLBACK事件（MHA已不再使用这个工具） purge_relay_logs #清除中继日志（不会阻塞SQL线程）

6.2.3 配置MHA 的管理环境

1.生产配置目录和配置文件

[root@mysql-mha ~]# masterha_manager --help
Usage:
   masterha_manager --global_conf=/etc/masterha_default.cnf #全局配置文件，记录
公共设定
   --conf=/usr/local/masterha/conf/app1.cnf #不同管理配置文件，记录各自配
置
   See online reference
   (http://code.google.com/p/mysql-master-ha/wiki/masterha_manager) for
   details.

因为我们当前只有一套主从，所以我们只需要写一个配置文件即可 rpm包中没有为我们准备配置文件的模板可以解压源码包后在samples中找到配置文件的模板文件

[root@MHA MHA-7]# mkdir /etc/masterha
[root@MHA MHA-7]# tar zxf mha4mysql-manager-0.58.tar.gz
[root@MHA MHA-7]# cd mha4mysql-manager-0.58/samples/conf/
[root@MHA conf]# cat masterha_default.cnf app1.cnf > /etc/masterha/app1.cnf

#编辑配置文件
[root@mysql-mha ~]# vim /etc/masterha/app1.cnf
[server default]
user=root #mysql管理员用户，因为需要做自动化配置
password=lee #mysql密码
ssh_user=root #ssh远程登陆用户
repl_user=repl #mysql主从复制中负责认证的用户
repl_password=lee #mysql主从复制中负责认证的用户密码
master_binlog_dir= /data/mysql #二进制日志目录
remote_workdir=/tmp #远程工作目录
#此参数使为了提供冗余检测，方式是mha主机网络自身的问题无法连接数据库节点，应为集群之外的主机
secondary_check_script= masterha_secondary_check -s 172.25.254.10 -s 
172.25.254.11
ping_interval=3 #每隔3秒检测一次
#发生故障后调用的脚本，用来迁移vip
# master_ip_failover_script= /script/masterha/master_ip_failover
#电源管理脚本
# shutdown_script= /script/masterha/power_manager
#当发生故障后用此脚本发邮件或者告警通知
# report_script= /script/masterha/send_report
#在线切换时调用的vip迁移脚本，手动
# master_ip_online_change_script= /script/masterha/master_ip_online_change
manager_workdir=/etc/masterha #mha工作目录
manager_log=/var/etc/masterha/manager.log #mha日志
[server1] 
hostname=172.25.254.10 
candidate_master=1 #可能作为master的主机
check_repl_delay=0 ##默认情况下如果一个slave落后master 100M的relay logs的话
 #MHA将不会选择该slave作为一个新的master
 #因为对于这个slave的恢复需要花费很长时间
 #通过设置check_repl_delay=0
 #MHA触发切换在选择一个新的master的时候将会忽略复制延时
 #这个参数对于设置了candidate_master=1的主机非常有用
 #因为这个候选主在切换的过程中一定是新的master
[server2]
hostname=172.25.254.20
candidate_master=1 #可能作为master的主机
check_repl_delay=0
[server3]
hostname=172.25.254.30
no_master=1 #不会作为master的主机

2.检测配置：
在所有服务器上配置无密码认证
在 manager 节点上配置到所有数据库节点的无密码认证
ssh-keygen -t rsa               #一路按回车键
ssh-copy-id 172.25.254.10
ssh-copy-id 172.25.254.20
ssh-copy-id 172.25.254.30
在master上配置到数据库节点 slave1和 slave2的无密码认证
ssh-keygen -t rsa
ssh-copy-id 172.25.254.20
ssh-copy-id 172.25.254.30
3.在 slave1 上配置到数据库节点 master和 salve2的无密码认证
ssh-keygen -t rsa
ssh-copy-id 172.25.254.10
ssh-copy-id 172.25.254.30
在 salve2 上配置到数据库节点 master 和 slave1的无密码认证
ssh-keygen -t rsa
ssh-copy-id 172.25.254.10
ssh-copy-id 172.25.254.20

a）检测网络及ssh免密
[root@mysql-mha ~]# masterha_check_ssh --conf=/etc/masterha/app1.cnf

 b）检测数据主从复制情况
[root@mgt mha4mysql-manager-0.57]# cp sample/scripts/master_ip_failover /usr/local/bin/
[root@mgt mha4mysql-manager-0.57]# cp sample/scripts/master_ip_online_change     /usr/local/bin/
[root@mgt mha4mysql-manager-0.57]# ll /usr/local/bin/scripts/
#脚本说明
master_ip_failover          #自动切换时 VIP 管理的脚本
master_ip_online_change     #在线切换时 vip 的管理
power_manager                 #故障发生后关闭主机的脚本
send_report                 #因故障切换后发送报警的脚本
b）检测数据主从复制情况
#在数据节点master端
mysql> GRANT ALL ON *.* TO root@'%' identified by 'lee'; #允许root远程登陆
#执行检测
[root@mysql-mha ~]# masterha_check_repl --conf=/etc/masterha/app1.cnf

6.2.4 MHA的故障切换

MHA的故障切换过程共包括以下的步骤：

1.配置文件检查阶段，这个阶段会检查整个集群配置文件配置

2.宕机的master处理，这个阶段包括虚拟ip摘除操作，主机关机操作

3.复制dead master和最新slave相差的relay log，并保存到MHA Manger具体的目录下

4.识别含有最新更新的slave

5.应用从master保存的二进制日志事件（binlog events）

6.提升一个slave为新的master进行复制

7.使其他的slave连接新的master进行复制

切换方式： master未出现故障手动切换

#在master数据节点还在正常工作情况下
[root@mysql-mha ~]# masterha_master_switch \
--conf=/etc/masterha/app1.cnf \ #指定配置文件
--master_state=alive \ #指定master节点状态
--new_master_host=172.25.254.20 \ #指定新master节点
--new_master_port=3306 \ #执行新master节点端口
--orig_master_is_new_slave \ #原始master会变成新的slave
--running_updates_limit=10000 #切换的超时时间

检测：

[root@mysql-mha masterha]# masterha_check_repl --conf=/etc/masterha/app1.cnf

master故障手动切换

#模拟master故障
[root@mysql-node20 mysql]# /etc/init.d/mysqld stop
#在MHA-master中做故障切换
[root@mysql-mha masterha]# masterha_master_switch --master_state=dead --
conf=/etc/masterha/app1.cnf --dead_master_host=192.168.56.12 --
dead_master_port=3306 --new_master_host=192.168.56.11 --new_master_port=3306 --
ignore_last_failover
--ignore_last_failover 表示忽略在/etc/masterha/目录中在切换过程中生成的锁文件

恢复故障mysql节点

[root@mysql-node2 tmp]# /etc/init.d/mysqld start
Starting MySQL. SUCCESS!
[root@mysql-node2 tmp]# mysql -p
mysql> CHANGE MASTER TO MASTER_HOST='172.25.254.10', MASTER_USER='repl', 
MASTER_PASSWORD='lee', MASTER_AUTO_POSITION=1;
mysql> show slave\G

#测试一主两从是否正常
[root@mysql-node2 tmp]# masterha_check_repl --conf=/etc/masterha/app1.cnf

自动切换

[root@mysql-mha masterha]# rm -fr app1.failover.complete #删掉切换锁文件
#监控程序通过指定配置文件监控master状态，当master出问题后自动切换并退出避免重复做故障切换
[root@mysql-mha masterha]# masterha_manager --conf=/etc/masterha/app1.cnf 
[root@mysql-mha masterha]# cat /etc/masterha/manager.log
#恢复故障节点

恢复故障节点

[root@mysql-node20 mysql]# /etc/init.d/mysqld start
mysql> CHANGE MASTER TO MASTER_HOST='172.25.254.10', MASTER_USER='repl', 
MASTER_PASSWORD='lee', MASTER_AUTO_POSITION=1

清除锁文件
root@mysql-mha masterha]# rm -rf app1.failover.complete manager.log

6.2.5为MHA添加VIP功能

[root@mysql-mha ~]# ls
master_ip_failover master_ip_online_change MHA-7 MHA-7.zip
[root@mysql-mha ~]# cp master_ip_failover master_ip_online_change 
/usr/local/bin/
[root@mysql-mha ~]# chmod +x /usr/local/bin/master_ip_*
#修改脚本在脚本中只需要修改下vip即可
[root@mysql-mha ~]# vim /usr/local/bin/master_ip_failover
my $vip = '172.25.254.100/24';
my $ssh_start_vip = "/sbin/ip addr add $vip dev eth0";
my $ssh_stop_vip = "/sbin/ip addr del $vip dev eth0";

[root@mysql-mha ~]# vim /usr/local/bin/master_ip_online_change
my $vip = '172.25.254.100/24';
my $ssh_start_vip = "/sbin/ip addr add $vip dev eth0";
my $ssh_stop_vip = "/sbin/ip addr del $vip dev eth0";
my $exit_code = 0;

[root@mysql-mha masterha]# masterha_manager --conf=/etc/masterha/app1.cnf & 启动监
控程序
[root@mysql-node1 ~]# ip a a 172.25.254.100/24 dev eth1  #在master节点添加VIP

模拟故障

[root@mysql-node1 ~]# /etc/init.d/mysqld stop #关闭主节点服务
[root@mysql-mha masterha]# cat manager.log

恢复故障主机
[root@mysql-node2 mysql]# /etc/init.d/mysqld start
mysql> CHANGE MASTER TO MASTER_HOST='172.25.254.10', MASTER_USER='repl', 
MASTER_PASSWORD='lee', MASTER_AUTO_POSITION=1
[root@mysql-mha masterha]# rm -rf app1.failover.complete manager.log

手动切换后查看vip变化

[root@mysql-mha masterha]# masterha_master_switch --conf=/etc/masterha/app1.cnf 
--master_state=alive --new_master_host=172.25.254.10 --new_master_port=3306 --
orig_master_is_new_slave --running_updates_limit=10000