目录
一、TCP报文格式
6位标志位:
URG
:紧急指针是否有效
ACK
:确认号是否有效
PSH
:提示接收端应用程序立刻从
TCP
缓冲区把数据读走
RST
:对方要求重新建立连接;我们把携带
RST
标识的称为
复位报文段
SYN
:请求建立连接;我们把携带
SYN
标识的称为
同步报文段
FIN
:通知对方,本端要关闭了,我们称携带
FIN
标识的为
结束报文段
16
位校验和:发送端填充,
CRC
校验。接收端校验不通过,则认为数据有问题。此处的检验和不光包含TCP
首部,也包含
TCP
数据部分。
16
位紧急指针:标识哪部分数据是紧急数据;
40
字节头部选项:暂时忽略;
二、TCP原理
1.超时重传机制(安全机制)
TCP为了保证无论在任何环境下都能比较高性能的通信,因此会动态计算这个最大超时时间。
- Linux中(BSD Unix和Windows也是如此),超时以500ms为一个单位进行控制,每次判定超时重发的超时时间都是500ms的整数倍。
- 如果重发一次之后,仍然得不到应答,等待 2*500ms 后再进行重传。如果仍然得不到应答,等待 4*500ms 进行重传。依次类推,以指数形式递增。
- 累计到一定的重传次数,TCP认为网络或者对端主机出现异常,强制关闭连接。
2.连接管理机制(安全机制)
在正常情况下,
TCP要经过三次握手建立连接,四次挥手断开连接。
3.滑动窗口(效率机制)
4.流量控制(安全机制)
接收端处理数据的速度是有限的。如果发送端发的太快,导致接收端的缓冲区被打满,这个时候如果发
送端继续发送,就会造成丢包,继而引起丢包重传等等一系列连锁反应。
因此
TCP
支持根据接收端的处理能力,来决定发送端的发送速度。这个机制就叫做
流量控制(
Flow
Control
)
;
- 接收端将自己可以接收的缓冲区大小放入 TCP 首部中的 "窗口大小" 字段,通过ACK端通知发 送端;
- 窗口大小字段越大,说明网络的吞吐量越高;
- 接收端一旦发现自己的缓冲区快满了,就会将窗口大小设置成一个更小的值通知给发送端;
- 发送端接受到这个窗口之后,就会减慢自己的发送速度;
- 如果接收端缓冲区满了,就会将窗口置为0;这时发送方不再发送数据,但是需要定期发送一 个窗口探测数据段,使接收端把窗口大小告诉发送端。
5.拥塞控制(安全机制)
虽然
TCP
有了滑动窗口这个大杀器,能够高效可靠的发送大量的数据。但是如果在刚开始阶段就发送大 量的数据,仍然可能引发问题。 因为网络上有很多的计算机,可能当前的网络状态就已经比较拥堵。在不清楚当前网络状态下,贸然发送给大量的数据,是很有可能引起雪上加霜的。TCP引入 慢启动
机制,先发少量的数据,探探路,摸清当前的网络拥堵状态,再决定按照多大的速度传输数据;
6.延迟应答(效率机制)
如果接收数据的主机立刻返回
ACK
应答,这时候返回的窗口可能比较小。
- 假设接收端缓冲区为1M。一次收到了500K的数据;如果立刻应答,返回的窗口就是500K;
- 但实际上可能处理端处理的速度很快,10ms之内就把500K数据从缓冲区消费掉了;
- 在这种情况下,接收端处理还远没有达到自己的极限,即使窗口再放大一些,也能处理过来;
- 如果接收端稍微等一会再应答,比如等待200ms再应答,那么这个时候返回的窗口大小就是 1M;
一定要记得,窗口越大,网络吞吐量就越大,传输效率就越高。我们的目标是在保证网络不拥塞的情况
下尽量提高传输效率;
那么所有的包都可以延迟应答么?肯定也不是;
- 数量限制:每隔N个包就应答一次;
- 时间限制:超过最大延迟时间就应答一次;
具体的数量和超时时间,依操作系统不同也有差异;一般
N
取
2
,超时时间取
200ms
;
7.捎带应答(效率机制)
在延迟应答的基础上,我们发现,很多情况下,客户端服务器在应用层也是
"
一发一收
"
的。意味着客户 端给服务器说了 "How are you"
,服务器也会给客户端回一个
"Fine, thank you"
; 那么这个时候ACK
就可以搭顺风车,和服务器回应的
"Fine
,
thank you"
一起回给客户端。
其他特性:面向字节流
其他特性:缓冲区
其他特性:大小限制
创建一个TCP的socket,同时在内核中创建一个 发送缓冲区 和一个 接收缓冲区;
- 调用write时,数据会先写入发送缓冲区中;
- 如果发送的字节数太长,会被拆分成多个TCP的数据包发出;
- 如果发送的字节数太短,就会先在缓冲区里等待,等到缓冲区长度差不多了,或者其他合适 的时机发送出去;
- 接收数据的时候,数据也是从网卡驱动程序到达内核的接收缓冲区;
- 然后应用程序可以调用read从接收缓冲区拿数据;
- 另一方面,TCP的一个连接,既有发送缓冲区,也有接收缓冲区,那么对于这一个连接,既 可以读数据,也可以写数据。这个概念叫做 全双工
由于缓冲区的存在,
TCP
程序的读和写不需要一一匹配,例如:
- 写100个字节数据时,可以调用一次write写100个字节,也可以调用100次write,每次写一 个字节;
- 读100个字节数据时,也完全不需要考虑写的时候是怎么写的,既可以一次read 100个字节,也可以一次read一个字节,重复100次;