GreatSQL Shell如何接管手动搭建（含仲裁节点）MGR集群

最新推荐文章于 2024-10-14 16:42:33 发布

老叶茶馆_

最新推荐文章于 2024-10-14 16:42:33 发布

阅读量77

点赞数

文章标签： linux 运维服务器

原文链接：https://mp.weixin.qq.com/s?__biz=MjM5NzAzMTY4NQ==&mid=2653941042&idx=1&sn=dc9fe75b6953417ee0ce0335cdf4e9dc&chksm=bc993866078f1378bd2c7e3d7133aab60d5bafd7a552793ab8677496a80b864d1789750c41c2&scene=126&sessionid=0

版权

* GreatSQL社区原创内容未经授权不得随意使用，转载请联系小编并注明来源。

本文源自GreatSQL社区用户的一次提问：

Q：一个包含仲裁节点（ARBITRATOR）的GreatSQL MGR集群，一开始是用手动方式构建，后来想用GreatSQL Shell接管，可以吗？

A：是可以的，不过也有一定局限性

具体的操作如下

检查当前MGR集群情况

greatsql> select * from performance_schema.replication_group_members;
+---------------------------+--------------------------------------+---------------+-------------+--------------+-------------+----------------+----------------------------+
| CHANNEL_NAME              | MEMBER_ID                            | MEMBER_HOST   | MEMBER_PORT | MEMBER_STATE | MEMBER_ROLE | MEMBER_VERSION | MEMBER_COMMUNICATION_STACK |
+---------------------------+--------------------------------------+---------------+-------------+--------------+-------------+----------------+----------------------------+
| group_replication_applier | 04b57be0-73a0-11ee-a450-00155d064000 | 192.168.5.170 |     3307    | ONLINE       | SECONDARY   | 8.0.32         | XCom               |
| group_replication_applier | 0b157081-73a7-11ee-899b-00155d064000 | 192.168.5.170 |     3308    | ONLINE       | ARBITRATOR  | 8.0.32         | XCom               |
| group_replication_applier | d4b877cf-16f0-11ee-9e98-00155d064000 | 192.168.5.170 |     3306    | ONLINE       | PRIMARY     | 8.0.32         | XCom               |
+---------------------------+--------------------------------------+---------------+-------------+--------------+-------------+----------------+----------------------------+
3 rows in set (0.00 sec)

可以看到三个节点都是ONLINE状态

专属账户增加相应授权

连接 Primary 节点，查看下原来的账户权限情况，对MGR专属账户增加相应授权

greatsql> show grants for GreatSQL;
+--------------------------------------------------+
| Grants for GreatSQL@%                            |
+--------------------------------------------------+
| GRANT REPLICATION SLAVE ON *.* TO `GreatSQL`@`%` |
| GRANT BACKUP_ADMIN ON *.* TO `GreatSQL`@`%`      |
+--------------------------------------------------+

可以看到该权限并不能足以让 GreatSQL Shell 使用，需要增加授权才可以

以下是用 GreatSQL Shell 接管的 MGR 集群专属账户授权，手动添加到权限一致即可

greatsql> show grants for GreatSQL;
# 只展示关键权限部分
| GRANT SELECT, RELOAD, SHUTDOWN, PROCESS, FILE, EXECUTE, REPLICATION SLAVE, REPLICATION CLIENT, CREATE USER ON *.* TO `GreatSQL`@`%` WITH GRANT OPTION|
| GRANT BACKUP_ADMIN ON *.* TO `GreatSQL`@`%`|
| GRANT CLONE_ADMIN,CONNECTION_ADMIN,GROUP_REPLICATION_ADMIN,PERSIST_RO_VARIABLES_ADMIN,REPLICATION_APPLIER,REPLICATION_SLAVE_ADMIN,ROLE_ADMIN,SYSTEM_VARIABLES_ADMIN ON *.* TO `GreatSQL`@`%` WITH GRANT OPTION|
| GRANT INSERT, UPDATE, DELETE ON `mysql`.* TO `GreatSQL`@`%` WITH GRANT OPTION|
| GRANT INSERT, UPDATE, DELETE, CREATE, DROP, REFERENCES, INDEX, ALTER, CREATE TEMPORARY TABLES, LOCK TABLES, EXECUTE, CREATE VIEW, SHOW VIEW, CREATE ROUTINE, ALTER ROUTINE, EVENT, TRIGGER ON `mysql_innodb_cluster_metadata`.* TO `GreatSQL`@`%` WITH GRANT OPTION          |
| GRANT INSERT, UPDATE, DELETE, CREATE, DROP, REFERENCES, INDEX, ALTER, CREATE TEMPORARY TABLES, LOCK TABLES, EXECUTE, CREATE VIEW, SHOW VIEW, CREATE ROUTINE, ALTER ROUTINE, EVENT, TRIGGER ON `mysql_innodb_cluster_metadata_bkp`.* TO `GreatSQL`@`%` WITH GRANT OPTION      |
| GRANT INSERT, UPDATE, DELETE, CREATE, DROP, REFERENCES, INDEX, ALTER, CREATE TEMPORARY TABLES, LOCK TABLES, EXECUTE, CREATE VIEW, SHOW VIEW, CREATE ROUTINE, ALTER ROUTINE, EVENT, TRIGGER ON `mysql_innodb_cluster_metadata_previous`.* TO `GreatSQL`@`%` WITH GRANT OPTION |

上述授权工作在 Primary 节点执行完后，Secondary节点会自动跟随。ARBITRATOR节点需要手动处理。

ARBITRATOR节点手动增加授权

修改 **ARBITRATOR **节点的my.cnf，关闭 ARBITRATOR 角色

（设置 group_replication_arbitrator = 0），并记得确保MGR不会自动启动

（设置 group_replication_start_on_boot = OFF），然后重启该实例。

重启完成后，此时尚未启动MGR进程，因此 ARBITRATOR 节点会变成一个普通实例，可以对其进行读写操作。

-- 手动增加相应授权
greatsql> set sql_log_bin = 0;
-- 参考第2步，手动增加相应授权
greatsql> GRANT ....

确认授权完成后，即可关闭该实例，重新启用 ARBITRATOR 角色（设置 group_replication_arbitrator = 1），重启实例，但先不启动 MGR进程，后面再说。

用GreatSQL Shell接管MGR

利用GreatSQL Shell接管现有MGR：

mysqlsh> c=dba.create_cluster("mgr",{"adoptFromGR": "true"})

参数{"adoptFromGR": "true"}的作用就是告诉GreatSQL Shell，接管现有MGR集群，而不是全新创建一个。

之后会很顺利地完成接管，此时只有 Primary 和 Secondary 两个节点：

shell> c=dba.create_cluster("mgr", {"adoptFromGR":"true"})
A new InnoDB cluster will be created based on the existing replication group on instance '127.0.0.1:3306'.

Creating InnoDB cluster 'mgr' on '192.168.5.170:3306'...

Adding Seed Instance...
Adding Instance '192.168.5.170:3307'...
Adding Instance '192.168.5.170:3306'...
Resetting distributed recovery credentials across the cluster...
NOTE: User 'mysql_innodb_cluster_3307'@'%' already existed at instance '192.168.5.170:3306'. It will be deleted and created again with a new password.
Cluster successfully created based on existing replication group.

查看下状态

shell> c.status()
{
  "clusterName": "mgr",
  "defaultReplicaSet": {
     "name": "default",
     "primary": "192.168.5.170:3306",
     "ssl": "DISABLED",
     "status": "OK_NO_TOLERANCE",
     "statusText": "Cluster is NOT tolerant to any failures.",
     "topology": {
        "192.168.5.170:3306": {
          "address": "192.168.5.170:3306",
          "memberRole": "PRIMARY",
          "mode": "R/W",
          "readReplicas": {},
          "replicationLag": null,
          "role": "HA",
          "status": "ONLINE",
          "version": "8.0.32"
        },
        "192.168.5.170:3307": {
          "address": "192.168.5.170:3307",
          "memberRole": "SECONDARY",
          "mode": "R/O",
          "readReplicas": {},
          "replicationLag": null,
          "role": "HA",
          "status": "ONLINE",
          "version": "8.0.32"
        }
     },
     "topologyMode": "Single-Primary"
  },
  "groupInformationSourceMember": "192.168.5.170:3306"
}

连接ARBITRATOR节点，启动MGR进程

连接 ARBITRATOR 节点，并执行 start group_replication 启动MGR进程，此时能看到各节点状态工作正常：

greatsql> select * from performance_schema.replication_group_members;
+---------------------------+--------------------------------------+---------------+-------------+--------------+-------------+----------------+----------------------------+
| CHANNEL_NAME              | MEMBER_ID                            | MEMBER_HOST   | MEMBER_PORT | MEMBER_STATE | MEMBER_ROLE | MEMBER_VERSION | MEMBER_COMMUNICATION_STACK |
+---------------------------+--------------------------------------+---------------+-------------+--------------+-------------+----------------+----------------------------+
| group_replication_applier | 04b57be0-73a0-11ee-a450-00155d064000 | 192.168.5.170 |        3307 | ONLINE       | SECONDARY   | 8.0.32         | XCom                       |
| group_replication_applier | 0b157081-73a7-11ee-899b-00155d064000 | 192.168.5.170 |        3308 | ONLINE       | ARBITRATOR  | 8.0.32         | XCom                       |
| group_replication_applier | d4b877cf-16f0-11ee-9e98-00155d064000 | 192.168.5.170 |        3306 | ONLINE       | PRIMARY     | 8.0.32         | XCom                       |
+---------------------------+--------------------------------------+---------------+-------------+--------------+-------------+----------------+----------------------------+
3 rows in set (0.00 sec)

切换到 GreatSQL Shell 查看

shell> c.status()

    "clusterName": "mgr",
    "defaultReplicaSet": {
        "name": "default",
        "primary": "192.168.5.170:3306",
        "ssl": "DISABLED",
        "status": "OK",
        "statusText": "Cluster is ONLINE and can tolerate up to ONE failure.",
        "topology": {
            "192.168.5.170:3306": {
                "address": "192.168.5.170:3306",
                "memberRole": "PRIMARY",
                "mode": "R/W",
                "readReplicas": {},
                "replicationLag": null,
                "role": "HA",
                "status": "ONLINE",
                "version": "8.0.32"
            },
            "192.168.5.170:3307": {
                "address": "192.168.5.170:3307",
                "memberRole": "SECONDARY",
                "mode": "R/O",
                "readReplicas": {},
                "replicationLag": null,
                "role": "HA",
                "status": "ONLINE",
                "version": "8.0.32"
            },
            "192.168.5.170:3308": {
                "address": "192.168.5.170:3308",
                "instanceErrors": [
                    "WARNING: Instance is not managed by InnoDB cluster. Use cluster.rescan() to repair."
                ],
                "memberRole": "ARBITRATOR",
                "mode": "R/O",
                "readReplicas": {},
                "replicationLag": null,
                "role": "HA",
                "status": "ONLINE",
                "version": "8.0.32"
            }
        },
        "topologyMode": "Single-Primary"
    },
    "groupInformationSourceMember": "192.168.5.170:3306"
}

可以看到已经能看到所有节点，包括 ARBITRATOR 节点，但是因为该节点无法对其进行读写，所以实际上 GreatSQL Shell 接入时的一些初始化工作还是没完全执行，所以才有上面的提示：

"instanceErrors": [
"WARNING: Instance is not managed by InnoDB cluster. Use cluster.rescan() to repair."
],

不过并不影响，因为该节点只需参与MGR投票即可，可以忽略这个错误。

不知道注意到了没有，在这个过程中，并不需要像添加常规 Secondary 节点那样要 CLONE 全量数据。

提醒：后续如果要通过 GreatSQL Shell 对 MGR 做些操作，可能 ARBITRATOR 节点会提示不支持，此时只需临时把 ARBITRATOR 的MGR进程关闭，必要的操作执行完毕后再次启动MGR进程即可。

至此，就完成了 GreatSQL Shell 接管 MGR 集群的过程。

这里附带几个FAQ：

Q：在GreatSQL MGR集群中，新增 ARBITRATOR 节点时，是否一定要 CLONE 数据？

因为如果当前 Primary 节点上数据量巨大时，每次都 CLONE 代价太高了，那么第一次加入 ARBITRATOR 节点的成本有点难以接受。

A：当MGR中Primary节点已有用户数据时，无论是用GreatSQL Shell 还是手动加入一个新的仲裁节点（ARBITRATOR），首次加入都需要经过 CLONE 的过程（即便是在启动前已经设置group_replication_arbitrator = 1）
变通的办法有几个：

第一个加入的ARBITRATOR节点，可以在加入成功后，关闭ARBITRATOR角色，然后删除所有用户数据，这时候就变成一个空实例了，再次重启后，再开启ARBITRATOR角色，不会再次 CLONE 数据。
在上述第一个ARBITRATOR节点的基础上，在其关闭期间，做一次物理全备，然后这个备份就可以作为未来新的ARBITRATOR节点的datadir，再次加入MGR集群也不会再次 CLONE 数据。

实际上，在加入 MGR 时，判断是否需要 CLONE 数据的依据是看 gtid_purged ，因此还有第三个办法：