关于TCP保活功能及其应用

      本文转自老衲五木 的新浪微博

      保活功能是TCP很重要的一个特性,它在连接异常检测,异常处理上起着至关重要的作用。一个网络应用程序是否稳定可靠,连接的异常处理尤为重要。很多人反应,LwIP做客户端时,是不是很不稳定,经常会莫名掉线。老衲想说的是,应为网络,硬件,环境等等太多原因,掉线是正常的,你应该把它看作一种常态,你对连接异常的处理有哪些,处理的怎么样,这些决定了你的代码的稳定性和可用性。

      服务器运行中突然断电、服务器软件异常莫名死机、通信过程中网络故障、人为拔掉网线等等,这些都属于连接异常的范畴。

      LwIP内核中提供了TCP保活功能,用来随时监测连接的可用性,如果连接不可用,内核会对该连接进行异常处理(通常是多次试探,失败后断开连接,并通知一个事件给用户)。通常用户可以收到一个可读的事件,此时用户对连接任何读写操作都会立即返回错误(socket的话errno记录了具体的错误值),此时用户的正确处理应该是关闭连接,而不是循环尝试在连接上进行更多的数据发送或接收操作。当然,用户可以选择在后续某个恰当的时候重新打开连接(客户端常用的方式是重新尝试连接,连接失败则重复尝试),这些是用户应用程序设计应该考虑的问题。

      那么,在LwIP中如何应用保活特性呢?如果你使用的是socket编程,那么很简单:

int opt = 1;
setsockopt(socket,SOL_SOCKET, SO_KEEPALIVE, &opt, sizeof(int));

      这句就可以开启该连接上的保活功能,后续若连接异常,内核会在该socket通知一个可读事件,此时用户调用读写操作时,内核会返回错误。应用程序应及时对这种异常进行处理。

    

       如果你使用的是rawapi编程,那流程可能比较麻烦,需要细分为两种情况:

  1. 如果你程序做的是服务器,那这种情况比较简单,内核已经对每个连接默认开启了保活功能,当连接异常时,内核会通知你一个err的回调。(注:经过博主自己验证, lwip1.4.1版本用作服务器时, 并不会默认开启保活功能.)
  2. 如果你程序做的是客户端,这种情况下比较麻烦,内核没有默认给你打开保活功能,此时需要自己动手啦,通常在建立连接的时候这样做即可:
pcb = tcp_new();
ip_set_option(pcb,SOF_KEEPALIVE);

       这样,如果你的客户端检测到连接异常,则会有一个err回调到用户程序,同样,你需要在回调中处理这个异常。也可以在这里重新发起一个连接尝试。

       最后,需要指出的是,在内核中默认的一些保活参数的配置,可能并不一定能满足你应用程序的需求,比如保活开始的时间、发送保活的时间间隔、一共发送多少次保活包等等,你可以在lwipopts.h里面进行配置,比如:

#define LWIP_TCP_KEEPALIVE         1      //开启用户自定义保活时间,这个值如果为0,则系统使用默认的保活时间参数(这些参数可能不是你想要的,比如内核默认在连接双方都没有数据交互2个小时后,再发送保活探测包,对于拔网线这种异常,2小时太久了,用户期望能在越短的时间内检测出异常越好)

#define TCP_KEEPIDLE_DEFAULT        60000   //60秒内连接双方都无数据,则发起保活探测(该值默认为2小时)
#define TCP_KEEPINTVL_DEFAULT       10000   //每10秒发送一次保活探测
#define TCP_KEEPCNT_DEFAULT        9        //一共发送9次保活探测包,如果这9个包对方均无回应,则表示连接异常,内核关闭连接,并发送err回调到用户程序

 

  • 3
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
lwip tcp保活是一种机制,用于检测TCP连接是否仍然有效并保持连接的稳定性。在lwIP协议栈中,通过设置SO_KEEPALIVE标志来开启TCP保活选项。当连接处于ESTABLISHED或CLOSE_WAIT状态时,如果开启了保活选项,lwIP会定期发送TCP保活探测数据包来检测对方是否仍然存在。 具体实现中,lwIP使用了两个参数:keep_idle和keep_intvl。keep_idle表示首个保活探测包发送之前的空闲时间,keep_intvl表示连续保活探测包之间的时间间隔。 如果在pcb->keep_cnt * pcb->keep_intvl的时间内没有收到对方的数据,则lwIP认为对方已经断开连接或不可达,会直接关闭本地连接。在代码中,如果满足这个条件,会输出相应的信息并关闭本地连接。 综上所述,lwip tcp保活是通过定期发送保活探测包来检测对方是否仍然存在,并在超时后关闭本地连接。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* [LWIP使用TCP自带的KEEPALIVE功能](https://blog.csdn.net/qq446252221/article/details/110439520)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 33.333333333333336%"] - *2* [CUBE配置STM32H750+Lan8720+FreeRTOS+lwip+掉线重连+KeepAlive移植工程文件 ](https://download.csdn.net/download/monei3525/12913098)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 33.333333333333336%"] - *3* [TCP/IP传输层协议实现 - TCP保活定时器(lwip)](https://blog.csdn.net/arm7star/article/details/117382423)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 33.333333333333336%"] [ .reference_list ]
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值