用心跳检测死TCP连接
介绍
网络可能会以许多方式失败,有时会很细微(例如高比率的数据包丢失)。中断的TCP连接需要比较长时间(例如,在Linux上默认是大约11分钟)才能被操作系统检测到。AMQP 0-9-1 提供心跳功能,以确保应用层及时发现连接中断(以及完全无响应的对等体)。心跳也可以防御某些网络设备,当一段时间内没有任何活动时,可能会终止空闲的TCP连接。
心跳超时间隔
心跳超时值的定义为:在RabbitMQ与客户端之间应该将对等TCP连接视作为无法访问(down)的时间段之后。此值在连接时由客户端和RabbitMQ服务器之间协商。客户端必须配置请求心跳。在RabbitMQ 3.0或更高版本中,Broker 将会默认尝试心跳值(尽管客户端仍可否决)。超时时间的单位为秒,默认值为 60 (在3.5.5之前为 580)
每间隔大约 timeout/2 秒发送一次心跳帧。在两次丢失心跳后,TCP对等体就被认为是无法访问的。不同的客户端对此有不同的显示,但TCP连接将会被关闭。当客户端检测到由于心跳而无法访问 RabbitMQ 节点时,需要重新连接。
任何流量(例如协议操作、发布的消息、确认)会计数有效的心跳数。客户端可以选择发送心跳帧,而不管连接是否有其他流量,但有些只在必要时才进行。
可以通过将超时间隔设置为 0 来禁用心跳。这不是推荐的做法。
Java客户端开启心跳
要在 Java 客户端开启心跳超时,请在创建连接之前使用 ConnectionFactory#setRequestedHeartbeat 进行设置。
ConnectionFactory cf = new ConnectionFactory();
// set the heartbeat timeout to 60 seconds