什么是心跳机制?
心跳机制是定时发送一个自定义的结构体(心跳包),让对方知道自己还活着,以确保连接的有效性的机制。
就是每隔几分钟发送一个固定信息给服务端,服务端收到后回复一个固定信息如果服务端几分钟内没有收到客户端信息则视客户端断开。
发包方:可以是客户也可以是服务端,一般而言,客户端主动向服务器发送心跳包,因为服务器向客户端发送心跳包会影像服务器性能。 心跳包之所以叫心跳包是因为:它像心跳一样每隔固定时间发一次,以此来告诉服务器,这个客户端还活着。事实上这是为了保持长连接,至于这个包的内容,是没有什么特别规定的,不过一般都是很小的包,或者只包含包头的一个空包。心跳包主要也就是用于长连接的保活和断线处理。一般的应用下,判定时间在30-40秒比较不错。如果实在要求高,那就在6-9秒。
为什么需要心跳机制
服务端需要同时处理上上千甚至上万的客户端的连接,所以每个连接资源都是很宝贵的,当客户端断开连接的时候服务端应该及时移出该连接。
正常情况下,客户端断开连接的时候,会和服务端进行四次挥手,服务端就知道这个连接已经不能用了优雅的退出监听消息。但是总会有意外,比如客户端忽然断网了,没电了,这个时候客户端肯定不可能按照流程和服务端进行挥手,不知道消息的服务端还傻傻的在那等着,不知道客户端早就走了。
这时候,心跳包就很完美的解决了此问题。客户端和服务端约定好了每隔一段时间就会发消息,如果服务端每过一段时间没有收到客户端的心跳消息就说明客户端出事了,服务端就删除此连接,确保资源最大化。
————————————————
心跳包的发送,通常有两种技术:
1.应用层自己实现的心跳包
client使用定时器,不断发送心跳
Server收到心跳后,回复一个包
Server为每个client启动超时定时器,如果在指定时间内没有收到client的心跳包,则client失效。
2.使用SO_KEEPALIVE套接字选项
在TCP的机制里面,本身是存在有心跳包的机制的,也就是TCP的选项. 不论是服务端还是客户端,一方开启KeepAlive功能后,就会自动在规定时间内向对方发送心跳包, 而另一方在收到心跳包后就会自动回复,以告诉对方我仍然在线。因为开启KeepAlive功能需要消耗额外的宽带和流量,所以TCP协议层默认并不开启默认的KeepAlive超时需要7,200,000 MilliSeconds, 即2小时,探测次数为5次。对于很多服务端应用程序来说,2小时的空闲时间太长。因此,我们需要手工开启KeepAlive功能并设置合理的KeepAlive参数