客户的一个TCP程序在空闲的时候,每200毫秒发送端会发送8个字节的心跳。 发现有近3秒的时
间不发送这种心跳, 业务只好把socket关了,关闭的时候,发现有13个心跳数
据合在一起发送。
我查了一下TCP发送代码(tcp_output.c,196行),它不发送8个字节的数据是为了避免silly
window syndrome。 详见TCP/IP 详解 第一卷 22.3 小节。 后来采取以下方法之一:
一、 用TCP_NODELAY 禁止Nagle 算法
二、 在心跳数据后面填充,直至大小为MSS
解决问题。
Nagle 算法的大意:
TCP 连接的发送方如果还有发出去的数据没有被ACK,那么小数据不会被立即发送直到那个数据被ACK,这些小数据会被累积起来放在一个segment被发送出去。
Nagle 也可以这样理解: 对方回复(回ACK)得慢,我方发送得也慢。 在此期间,积累小的数据。
Nagle 算法的目的是充分利用带宽,不频繁地发送小的数据,因为为了发送一个小数据,要在TCP/IP层和链路层加上头,开销是很大的。 这种想法是好的,但是干扰了某些想定时发送小数据的TCP程序。 所以有时候要禁止Nagle 算法,办法就是加上对socket 设置 TCP_NODELAY 选项。
参考 《TCP/IP 详解 第一卷 》19.4 小节。