目录
第十章 RabbitMQ 集群
10.1. clustering
10.1.1. 使用集群的原因
最开始我们介绍了如何安装及运行 RabbitMQ 服务,不过这些是单机版的,无法满足目前真实应用的要求。如果 RabbitMQ 服务器遇到内存崩溃、机器掉电或者主板故障等情况,该怎么办?单台 RabbitMQ 服务器可以满足每秒 1000 条消息的吞吐量,那么如果应用需要 RabbitMQ 服务满足每秒 10 万条消息的吞吐量呢?购买昂贵的服务器来增强单机 RabbitMQ 务的性能显得捉襟见肘,搭建一个 RabbitMQ 集群才是解决实际问题的关键。
10.1.2. 搭建步骤
1.修改 3 台机器的主机名称
vim /etc/hostname
2.配置各个节点的 hosts 文件,让各个节点都能互相识别对方
vim /etc/hosts
10.211.55.74 node1
10.211.55.75 node2
10.211.55.76 node3
3.以确保各个节点的 cookie 文件使用的是同一个值
在 node1 上执行远程操作命令
scp /var/lib/rabbitmq/.erlang.cookie root@node2:/var/lib/rabbitmq/.erlang.cookie
scp /var/lib/rabbitmq/.erlang.cookie root@node3:/var/lib/rabbitmq/.erlang.cookie
4.启动 RabbitMQ 服务,顺带启动 Erlang 虚拟机和 RbbitMQ 应用服务(在三台节点上分别执行以下命令)
rabbitmq-server -detached
5.在节点 2 执行
rabbitmqctl stop_app(rabbitmqctl stop 会将 Erlang 虚拟机关闭,rabbitmqctl stop_app 只关闭 RabbitMQ 服务)
rabbitmqctl reset
rabbitmqctl join_cluster rabbit@node1
rabbitmqctl start_app(只启动应用服务)
6.在节点 3 执行
rabbitmqctl stop_app
rabbitmqctl reset
rabbitmqctl join_cluster rabbit@node2
rabbitmqctl start_app
5、6之后的状态应该是这样
7.集群状态
rabbitmqctl cluster_status
8.需要重新设置用户
创建账号
rabbitmqctl add_user admin 123
设置用户角色
rabbitmqctl set_user_tags admin administrator
设置用户权限
rabbitmqctl set_permissions -p “/” admin “." ".” “.*”
之后登录哪一个都可以
可以看到这里有三个节点
9.解除集群节点(node2 和 node3 机器分别执行)
rabbitmqctl stop_app
rabbitmqctl reset
rabbitmqctl start_app
rabbitmqctl cluster_status
rabbitmqctl forget_cluster_node rabbit@node2(node1 机器上执行)
10.2. 镜像队列
10.2.1. 使用镜像的原因
如果 RabbitMQ 集群中只有一个 Broker 节点,那么该节点的失效将导致整体服务的临时性不可用,并 且也可能会导致消息的丢失。可以将所有消息都设置为持久化,并且对应队列的durable属性也设置为true, 但是这样仍然无法避免由于缓存导致的问题:因为消息在发送之后和被写入磁盘井执行刷盘动作之间存在一个短暂却会产生问题的时间窗。通过 publisherconfirm 机制能够确保客户端知道哪些消息己经存入磁盘, 尽管如此,一般不希望遇到因单点故障导致的服务不可用。
引入镜像队列(Mirror Queue)的机制,可以将队列镜像到集群中的其他 Broker 节点之上,如果集群中的一个节点失效了,队列能自动地切换到镜像中的另一个节点上以保证服务的可用性。
演示:
启动项目:注意IP
public class Producer {
// 队列名称
public static final String Queue_NAME = "hello";
//发消息
public static void main(String[] args) throws IOException, TimeoutException {
// 创建一个连接工厂
ConnectionFactory factory = new ConnectionFactory();
// 设置工厂IP:连接RabbitMQ的队列
factory.setHost("192.168.174.101");
// 用户名
factory.setUsername("admin");
// 密码
factory.setPassword("123");
// 创建连接
Connection connection = factory.newConnection();
// 获取信道
Channel channel = connection.createChannel();
/*
根据图示RabbitMQ的工作过程,我们应该通过连接交换机去连接队列,但我们这个简单的程序就先直接连接队列,跳过交换机
*/
// 创建一个队列
/**
* queueDeclare的参数:
* 1.队列名称
* 2.队列里面的消息是否持久化(存储在磁盘中),默认情况消息存储在内存中
* 3.该队列是否只供一个消费者进行消费、是否进行消息共享,true:只能一个消费着消费 ,false:可以多个消费者消费
* 4.是否自动删除,最后一个消费者断开连接以后,该队列是否自动删除,true:自动删除,false:不自动删除
* 5.其他参数(暂时写为null)
*/
channel.queueDeclare(Queue_NAME,true,false,false,null);
// 发消息
String message = "hello,world!";
/**
* 发送一个消息
* basicPublish的参数:
* 1.发送到哪个交换机(本程序没有使用交换机,所以为空)
* 2.路由的key值是哪个(本次是队列名称)
* 3.其他参数信息(本次为null)
* 4.发送的消息(不能直接发送消息,而是要发送对应的消息的二进制)
*/
channel.basicPublish("",Queue_NAME,null,message.getBytes());
System.out.println("消息发送完毕");
}
}
该队列只属于节点1的
关闭节点1
可以看到节点1变红
而且队列状态为down
获取消息,访问节点3
public class Consumer {
// 队列名称
public static final String QUEUE_NAME = "hello"; // 要与生产者发送消息的队列名称保持一致
// 接受消息
public static void main(String[] args) throws Exception{
// 创建连接工厂
ConnectionFactory factory = new ConnectionFactory();
factory.setHost("192.168.174.103"); // 演示10.2.1.
factory.setUsername("admin");
factory.setPassword("123");
Connection connection = factory.newConnection();
// 由连接创建一个信道
Channel channel = connection.createChannel();
/**
* 消费者接受消息
* basicConsume方法参数:
* 1.消费哪个队列
* 2.消费成功之后是否要自动应答,true:表示自动应答,false:手动应答
* 3.消费者未成功消费的回调(因为不是所有的情况下都能消费消息或者说接受消息)
* 4.消费者取消消费的回调
*/
// 回调是一个接口,需要实现接口(或者匿名内部类、lambda表达式的写法都可)
// 声明 接收消息
DeliverCallback deliverCallback = (consumerTag, message) -> {
System.out.println(new String(message.getBody()));
};
// 取消消息时的回调
CancelCallback cancelCallback = consumerTag -> {
System.out.println("消息消费被中断");
};
channel.basicConsume(QUEUE_NAME, true, deliverCallback, cancelCallback);
}
}
可以看到报错信息
重新启动节点1
节点1重新变绿
队列回来了,但看到消息不见了
且并没有被消费
重启消费者,仍然没有消息
造成了消息丢失,这就是引入镜像队列的原因
10.2.2. 搭建步骤
1.启动三台集群节点
2.随便找一个节点添加 policy
添加完后可以看到
3.在 node1 上创建一个队列发送一条消息,队列存在镜像队列
public class Producer {
// 队列名称
// public static final String Queue_NAME = "hello";
public static final String QUEUE_NAME = "mirrior_hello";
//发消息
public static void main(String[] args) throws IOException, TimeoutException {
// 创建一个连接工厂
ConnectionFactory factory = new ConnectionFactory();
// 设置工厂IP:连接RabbitMQ的队列
factory.setHost("192.168.174.101");
// 用户名
factory.setUsername("admin");
// 密码
factory.setPassword("123");
// 创建连接
Connection connection = factory.newConnection();
// 获取信道
Channel channel = connection.createChannel();
/*
根据图示RabbitMQ的工作过程,我们应该通过连接交换机去连接队列,但我们这个简单的程序就先直接连接队列,跳过交换机
*/
// 创建一个队列
/**
* queueDeclare的参数:
* 1.队列名称
* 2.队列里面的消息是否持久化(存储在磁盘中),默认情况消息存储在内存中
* 3.该队列是否只供一个消费者进行消费、是否进行消息共享,true:只能一个消费着消费 ,false:可以多个消费者消费
* 4.是否自动删除,最后一个消费者断开连接以后,该队列是否自动删除,true:自动删除,false:不自动删除
* 5.其他参数(暂时写为null)
*/
channel.queueDeclare(Queue_NAME,true,false,false,null);
// 发消息
String message = "hello,world!";
/**
* 发送一个消息
* basicPublish的参数:
* 1.发送到哪个交换机(本程序没有使用交换机,所以为空)
* 2.路由的key值是哪个(本次是队列名称)
* 3.其他参数信息(本次为null)
* 4.发送的消息(不能直接发送消息,而是要发送对应的消息的二进制)
*/
channel.basicPublish("",Queue_NAME,null,message.getBytes());
System.out.println("消息发送完毕");
}
}
可以看到队列这儿有个+1,+1就表示备份
点击去可以看到详细信息
4.停掉 node1 之后发现 node2 成为镜像队列
现在已经在节点2上了,且又备份到了节点3上
启动消费者,发现可以接受消息了
public class Consumer {
// 队列名称
public static final String QUEUE_NAME = "mirrior_hello";
// 接受消息
public static void main(String[] args) throws Exception{
// 创建连接工厂
ConnectionFactory factory = new ConnectionFactory();
factory.setHost("192.168.174.102"); // 演示 10.2.2
factory.setUsername("admin");
factory.setPassword("123");
Connection connection = factory.newConnection();
// 由连接创建一个信道
Channel channel = connection.createChannel();
/**
* 消费者接受消息
* basicConsume方法参数:
* 1.消费哪个队列
* 2.消费成功之后是否要自动应答,true:表示自动应答,false:手动应答
* 3.消费者未成功消费的回调(因为不是所有的情况下都能消费消息或者说接受消息)
* 4.消费者取消消费的回调
*/
// 回调是一个接口,需要实现接口(或者匿名内部类、lambda表达式的写法都可)
// 声明 接收消息
DeliverCallback deliverCallback = (consumerTag, message) -> {
System.out.println(new String(message.getBody()));
};
// 取消消息时的回调
CancelCallback cancelCallback = consumerTag -> {
System.out.println("消息消费被中断");
};
channel.basicConsume(QUEUE_NAME, true, deliverCallback, cancelCallback);
}
}
5.就算整个集群只剩下一台机器了依然能消费队列里面的消息,说明队列里面的消息被镜像队列传递到相应机器里面了。
10.3. Haproxy+Keepalive 实现高可用负载均衡
10.3.1. 整体架构图
10.3.2. Haproxy 实现负载均衡
HAProxy 提供高可用性、负载均衡及基于 TCPHTTP 应用的代理,支持虚拟主机,它是免费、快速并且可靠的一种解决方案,包括 Twitter,Reddit,StackOverflow,GitHub 在内的多家知名互联网公司在使用。 HAProxy 实现了一种事件驱动、单一进程模型,此模型支持非常大的井发连接数。
扩展 nginx,lvs,haproxy 之间的区别: l链接: link
10.3.3. 搭建步骤
1.下载 haproxy(在 node1 和 node2)
yum -y install haproxy
2.修改 node1 和 node2 的 haproxy.cfg
vim /etc/haproxy/haproxy.cfg
需要修改红色 IP 为当前机器 IP
3.在两台节点启动 haproxy
haproxy -f /etc/haproxy/haproxy.cfg
ps -ef | grep haproxy
4.访问地址
http://10.211.55.71:8888/stats
10.3.4. Keepalived 实现双机(主备)热备
试想如果前面配置的 HAProxy 主机突然宕机或者网卡失效,那么虽然 RbbitMQ 集群没有任何故障但是对于外界的客户端来说所有的连接都会被断开结果将是灾难性的为了确保负载均衡服务的可靠性同样显得十分重要,这里就要引入 Keepalived 它能够通过自身健康检查、资源接管功能做高可用(双机热备),实现故障转移。
10.3.5. 搭建步骤
1.下载 keepalived
yum -y install keepalived
2.节点 node1 配置文件
vim /etc/keepalived/keepalived.con
把资料里面的 keepalived.conf 修改之后替换
3.节点 node2 配置文件
需要修改 global_defs 的 router_id,如:nodeB
其次要修改 vrrp_instance_VI 中 state 为"BACKUP";
最后要将 priority 设置为小于 100 的值
4.添加 haproxy_chk.sh
(为了防止 HAProxy 服务挂掉之后 Keepalived 还在正常工作而没有切换到 Backup 上,所以这里需要编写一个脚本来检测 HAProxy 务的状态,当 HAProxy 服务挂掉之后该脚本会自动重启 HAProxy 的服务,如果不成功则关闭 Keepalived 服务,这样便可以切换到 Backup 继续工作)
vim /etc/keepalived/haproxy_chk.sh(可以直接上传文件)
修改权限 chmod 777 /etc/keepalived/haproxy_chk.sh
5.启动 keepalive 命令(node1 和 node2 启动)
systemctl start keepalived
6.观察 Keepalived 的日志
tail -f /var/log/messages -n 200
7.观察最新添加的 vip
ip add show
8.node1 模拟 keepalived 关闭状态
systemctl stop keepalived
9.使用 vip 地址来访问 rabbitmq 集群
10.4. Federation Exchange
10.4.1. 使用它的原因
(broker 北京),(broker 深圳)彼此之间相距甚远,网络延迟是一个不得不面对的问题。有一个在北京的业务(Client 北京) 需要连接(broker 北京),向其中的交换器 exchangeA 发送消息,此时的网络延迟很小, (Client 北京)可以迅速将消息发送至 exchangeA 中,就算在开启了 publisherconfirm 机制或者事务机制的情况下,也可以迅速收到确认信息。此时又有个在深圳的业务(Client 深圳)需要向 exchangeA 发送消息, 那么(Client 深圳) (broker 北京)之间有很大的网络延迟,(Client 深圳) 将发送消息至 exchangeA 会经历一定的延迟,尤其是在开启了 publisherconfirm 机制或者事务机制的情况下,(Client 深圳) 会等待很长的延迟时间来接收(broker 北京)的确认信息,进而必然造成这条发送线程的性能降低,甚至造成一定程度上的阻塞。
将业务(Client 深圳)部署到北京的机房可以解决这个问题,但是如果(Client 深圳)调用的另些服务都部署在深圳,那么又会引发新的时延问题,总不见得将所有业务全部部署在一个机房,那么容灾又何以实现? 这里使用 Federation 插件就可以很好地解决这个问题。
10.4.2. 搭建步骤
1.需要保证每台节点单独运行
2.在每台机器上开启 federation 相关插件
rabbitmq-plugins enable rabbitmq_federation
rabbitmq-plugins enable rabbitmq_federation_management
不需要重启RabbitMQ,刷新网页,如果出现这两个则说明安装成功
3.原理图(先运行 consumer 在 node2 创建 fed_exchange)
上游节点1的联邦交换机要想同步到下游的节点2的交换机
需要节点1的交换机配置好节点2的地址
首先需要在节点2创建好交换机
先在节点2上创建交换机和队列
public class Consumer1 {
// 队列名称
public static final String QUEUE_NAME = "node2_queue";
// 交换机的名称
public static final String FED_EXCHANGE = "fed_exchange";
// 接受消息
public static void main(String[] args) throws Exception{
// 创建连接工厂
ConnectionFactory factory = new ConnectionFactory();
factory.setHost("192.168.174.102");
factory.setUsername("admin");
factory.setPassword("123");
Connection connection = factory.newConnection();
// 由连接创建一个信道
Channel channel = connection.createChannel();
channel.exchangeDeclare(FED_EXCHANGE, BuiltinExchangeType.DIRECT);
channel.queueDeclare(QUEUE_NAME, true,false,false,null);
channel.queueBind(QUEUE_NAME, FED_EXCHANGE,"routeKey");
DeliverCallback deliverCallback = (consumerTag, message) -> {
System.out.println(new String(message.getBody()));
};
// 取消消息时的回调
CancelCallback cancelCallback = consumerTag -> {
System.out.println("消息消费被中断");
};
channel.basicConsume(QUEUE_NAME, true, deliverCallback, cancelCallback);
}
}
4.在 downstream(node2)配置 upstream(node1)
注意:在网页配置这些的时候,登录节点2的账号
5.添加 policy
6.成功的前提
这样就表示连接成功
10.5. Federation Queue
10.5.1. 使用它的原因
联邦队列可以在多个 Broker 节点(或者集群)之间为单个队列提供均衡负载的功能。一个联邦队列可以连接一个或者多个上游队列(upstream queue),并从这些上游队列中获取消息以满足本地消费者消费消息的需求。
10.5.2. 搭建步骤
1.原理图
2.添加 upstream(同上)
就使用这个即可
3.添加 policy
10.6. Shovel
10.6.1. 使用它的原因
Federation 具备的数据转发功能类似,Shovel 够可靠、持续地从一个 Broker 中的队列(作为源端,即 source)拉取数据并转发至另一个 Broker 中的交换器(作为目的端,即 destination)。作为源端的队列和作为目的端的交换器可以同时位于同一个 Broker,也可以位于不同的 Broker 上。Shovel 可以翻译为"铲子",是一种比较形象的比喻,这个"铲子"可以将消息从一方"铲子"另一方。Shovel 行为就像优秀的客户端应用程序能够负责连接源和目的地、负责消息的读写及负责连接失败问题的处理。
10.6.2. 搭建步骤
1.开启插件(需要的机器都开启)
rabbitmq-plugins enable rabbitmq_shovel
rabbitmq-plugins enable rabbitmq_shovel_management
刷新界面后,发现多了两个选项
2.原理图(在源头发送的消息直接回进入到目的地队列)
3.添加 shovel 源和目的地
这就达到队列Q1同步消息到Q2的效果