详解IM网关连接检测的原理与实现

本文详细介绍了实时音视频平台Sona的长连接网关如何通过TCP Keepalive和应用层心跳机制检测连接状态。讨论了TCP Keepalive的优缺点,并展示了在Netty中实现心跳检测的两种方法:IdleStateHandler和自定义HeartbeatTimerTask。文中还提到了主动消息探测策略,以更及时地发现无效连接。
摘要由CSDN通过智能技术生成

在长连接技术领域,实时探测连接是否正常,是一件既重要又复杂的事情。本文以开源项目SONA为例,详解长连接网关的连接检测的原理与实现,帮助读者理解相关技术,快速上手实践。本文最后附上开源项目地址。


前言

Sona 平台是一个搭建语音房产品的全端解决方案,包含了房间管理、实时音视频、房间IM、长连接网关等能力。其中最基础核心的就是长连接网关。

在长连接网关中,如何判断一个连接是否正常,是一个比较头疼的问题。连接的双方在连接空闲状态时,如果任意一方意外崩溃、宕机、网线断开或路由器故障,另一方无法得知TCP连接已经失效,除非继续在此连接上发送数据导致错误返回。很多时候,这不是我们需要的。我们希望服务器端和客户端都能够及时有效地检测到连接失效,然后优雅地完成一些清理工作。

如何及时有效地检测到一方的非正常断开,有两种技术可以运用。一种是由TCP协议层实现的Keepalive,另一种是由应用层自己实现的心跳包。


一、TCP Keepalive

TCP默认并不开启Keepalive功能,因为开启Keepalive功能需要消耗额外的宽带和流量,尽管这微不足道,但在按流量计费的环境下增加了费用,另一方面,Keepalive设置不合理时可能会因为短暂的网络波动而断开健康的TCP连接。并且,默认的Keepalive超时需要7200 秒,即2小时,探测次数为5次。

对于实用的程序来说,2小时的空闲时间太长。因此,我们需要手工开启Keepalive功能,设置SO_KEEPALIVE选项并设置相关参数,就可开启tcp协议的心跳机制

如果是基于 Netty 开发的话,使用如下方式即可

TCP Keepalive 虽然使用起来很方便,但是实际项目中一般都不会依靠它,而是业务心跳 + TCP KeepAlive 一起使用,互相作为补充。主要是因为:

  1. KeepAlive 的开关是在应用层开启的,但是具体参数(如重试测试,重试间隔时间)的设置却是操作系统级别的,位于操作系统的 /etc/sysctl.conf 配置中,这对于应用来说不够灵活。

  2. KeepAlive 的保活机制只在链路空闲的情况下才会起到作用,

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值