socket通信异常解决方式keepalive

通常一般的异常程序能够捕捉到,但是由于某端因为断网、断电而无法完成四次挥手时,tcp连接正常但是socket链路连接异常,在此情况下一般存在两种解决方式:
心跳检测机制

客户端定时发送心跳检测包给服务端,服务端收到该心跳包后回一个对应的心跳包,告知客户端自己正常。如果在设定的时间期限里没收到服务端发回的心跳检测包,那么客户端就主动断开socket并且尝试重新连接。
一般来说,服务端会与多个客户端进行通信,于是可以设置时间集合,当每次接收到客户端发来的信息(包括正常通信信息和心跳包)时就更新最后一次通信时间,设置一个定时器,定时检测时间集合中超时的客户端并且将其socket释放掉。
心跳检测机制在我的这篇博客有过说明
https://blog.csdn.net/weixin_42297324/article/details/108807939

Keep-Alive机制

网络异常断开原因归纳起来主要有以下两种:

1、客户端程序异常。
  对于这种情况,我们很好处理,因为客户端程序异常退出会在服务端引发ConnectionReset的Socket异常(就是WinSock2中的10054异常)。只要在服务端处理这个异常就可以了。

2、网络链路异常。
  如:网线拔出、交换机掉电、客户端机器掉电。当出现这些情况的时候服务端不会出现任何异常。

如果服务端不能够返回信息到客户端,那么心跳检测机制也就无用了。例如之前我所在的工厂产线上会有扫描枪扫描产品条码,但是有时因为断网就会导致tcp连接正常但是socket链路连接异常使得扫描枪无法正常工作,这种情况人为又无法发现,导致产线漏扫很多产品,导致生产滞后。
该扫描枪由硬件提供商开发,我无法修改扫描枪里面设定的程序让扫描枪返回状态,于是心跳检测机制在该场景下就无法应用。
这时就需要keepalive机制。

TCP有一个连接检测机制,就是如果在指定的时间内(一般为2个小时)没有数据传送,会给对端发送一个Keep-Alive数据报,使用的序列号是曾经发出的最后一个报文的最后一个字节的序列号,对端如果收到这个数据,回送一个TCP的ACK,确认这个字节已经收到,这样就知道此连接没有被断开。如果一段时间没有收到对方的响应,会进行重试,重试几次后,向对端发一个reset,然后将连接断掉。
我们可以更改keepalive参数,缩短检测时间,以下是keepalive方法(vb.net)

    'onOff:是否启用Keep-Alive
    'keepAliveTime:多长时间后开始第一次探测(单位:毫秒)
    'keepAliveInterval:探测时间间隔(单位:毫秒)
    Private Function KeepAlive(ByVal onOff As Integer, ByVal keepAliveTime As Integer, ByVal keepAliveInterval As Integer) As Byte()
        Dim buffer() As Byte = New Byte(12) {}
        BitConverter.GetBytes(onOff).CopyTo
  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值