文章目录
Preface
- TCP/IP协议是互联网的根基,它的重要性不用多说。
- 而TCP/IP协议栈的实现者是一个叫
Bill Joy
的天才程序员,他的主要成就包括: BSD Unix 内核, 自己实现了一套 TCP/IP 协议栈,vi 编辑器的作者,c shell的作者 ,Sparc处理器设计者之一,开发了Java中的Jini部分等。 - 当年 DARPA 和一个叫做 BBN 的公司签署了一个合同,要把 TCP/IP 协议加入到 Berkeley Unix 当中, 当研究生 Bill Joy 看到 BBN 写的 TCP/IP 实现时, 觉得非常差劲,拒绝把它加入内核, 后来干脆卷起袖子自己实现了一个高性能的 TCP/IP 栈,这个协议栈至今是互联网的基石。别人问他是怎么实现这么复杂的软件的, 这位大神说: “很简单啊, 你只需要看看协议, 然后把代码写出来就行了”
滑动窗口协议
发送窗口
描述一个发送窗口的状态需要三个指针:P1,P2和P3
- 小于P1的是已发送并已收到确认的部分,而大于P3的是不允许发送的部分
- P3–P1=A的
发送窗口
- P2–P1=已发送但尚未收到确认的字节数
- P3–P2=允许发送但当前尚未发送的字节数(又称为
可用窗口或有效窗口
)
连续ARQ协议
- 连续ARQ协议是
滑动窗口技术
和请求重传技术
的结合,ARQ意思就是就是自动重传请求(Automatic Repeat reQuest
)
连续ARQ协议最基本的概念
- 连续ARQ协议规定,发送方每收到一个确认,就把发送窗口向前滑动一个分组的位置。假设发送方收到了对第1个分组的确认,就把发送窗口向前移动一个分组的位置。如果原来已经发送了前5个分组,那么就可以发送窗口内的第6个分组了。
- 接收方一般都是采用累积确认的方式。这就是说,接收方不必对收到的分组逐个发送确认,而是在收到几个分组后,对按序到达的最后一个分组发送确认,这就表示:到这个分组为止的所有分组都已正确收到了
累积确认有优点也有缺点
- 优点是:容易实现,即使确认丢失也不必重传。
- 缺点是不能向发送方反映出接收方已经正确收到的所有分组的信息
- 例如,如果发送方发送了前5个分组,而中间的第3个分组丢失了。这时接收方只能对前两个分组发出确认。发送方无法知道后面三个分组的下落,而只好把后面的三个分组都再重传一次。这就叫做Go-back-N(回退N),表示需要再退回来重传已发送过的N个分组。
- 可见当通信线路质量不好时,连续ARQ协议会带来负面的影响
TCP拥塞控制
- TCP进行拥塞控制的算法有四种,即慢开始(slow-start)、拥塞避免(congestion avoidance)、快重传(fast retransmit)和快恢复(fast recovery)(见2009年9月公布的草案标准RFC 5681)
快重传
- 有时,个别报文段会在网络中丢失,但实际上网络并未发生拥塞。如果发送方迟迟收不到确认,就会产生超时,就会误认为网络发生了拥塞。这就导致发送方错误地启动慢开始,把拥塞窗口cwnd又设置为1,因而降低了传输效率
- 假设M2、M3是两个连续的报文段,M2接收方收到了,但M3没有收到
- 快重传算法规定,发送方只要一连收到3个重复确认(注意这个确认是对M2的确认),就知道接收方确实没有收到报文段M3,因而应当立即进行重传,这样就不会出现超时,发送方也不就会误认为出现了网络拥塞。
- 使用快重传可以使整个网络的吞吐量提高约20%。
TCP 3次握手建立连接的流程
假定主机A运行的是TCP客户程序,而B运行TCP服务器程序
- 一开始,B的TCP服务器进程创建传输控制块TCB,准备接受客户进程的连接请求。然后服务器进程就处于
LISTEN
(收听)状态,等待客户的连接请求 - A的TCP客户进程也是先创建TCB。然后,在打算建立TCP连接时,向B发出连接请求报文段,首部中的SYN=1,同时选择一个初始序号seq=x。TCP规定,SYN=1的报文段不能携带数据,但要消耗掉1个序号。这时,TCP客户进程进入
SYN-SENT
(同步已发送)状态。 - B收到连接请求报文段后,如同意建立连接,则向A发送确认报文段。把SYN位和ACK位都置1,确认号是ack=x+1,同时也为自己选择一个初始序号seq=y。注意,这个报文段也不能携带数据,但同样要消耗掉一个序号。这时TCP服务器进程进入
SYN-RCVD
(同步收到)状态 - TCP客户进程收到B的确认后,还要向B给出确认报文段。ACK=1,确认号ack=y+1,而自己的序号seq=x+1(TCP的标准规定,ACK报文段可以携带数据。但如果不携带数据则不消耗序号,在这种情况下,下一个数据报文段的序号仍是seq=x+1)。这时,TCP连接已经建立,A进入
ESTABLISHED
(已建立连接)状态。 - B收到A的确认后,也进入
ESTABLISHED
状态
3次握手时为什么A最后还要发送一次确认?
这主要是为了防止已失效的连接请求报文段突然又传送到了B,因而产生错误。例如:
- 假定出现一种异常情况,即A发出的第一个连接请求报文段在某些网络结点长时间滞留了,以致延误到连接释放以后的某个时间才到达B。本来这是一个早已失效的报文段。但B收到此失效的连接请求报文段后,就误认为是A又发出一次新的连接请求。于是就向A发出确认报文段,同意建立连接。假定不采用报文握手(即A再向B确认),那么只要B发出确认,新的连接就建立了
- 由于现在A并没有发出建立连接的请求,因此不会理睬B的确认,也不会向B发送数据。但B却以为新的运输连接已经建立了,并一直等待A发来数据。B的许多资源就这样白白浪费了
- 采用三报文握手的办法,可以防止上述现象的发生。例如在刚才的异常情况下,A不会向B的确认发出确认。B由于收不到确认,就知道A并没有要求建立连接。
如果已经建立了连接,但是客户端突然出现故障了怎么办?
- 除时间等待计时器(4次握手里的)外,TCP还设有一个
保活计时器(keepalive timer)
。 - 设想有这样的情况:客户已主动与服务器建立了TCP连接。但后来客户端的主机突然出故障。显然,服务器以后就不能再收到客户发来的数据。
- 因此,应当有措施使服务器不要再白白等待下去。这就是使用保活计时器。服务器每收到一次客户的数据,就重新设置保活计时器,时间的设置通常是两小时。
- 若两小时没有收到客户的数据,服务器就发送一个探测报文段,以后则每隔75秒钟发送一次。若一连发送10个探测报文段后仍无客户的响应,服务器就认为客户端出了故障,接着就关闭这个连接。
TCP的连接释放 4次握手的流程
数据传输结束后,通信的双方都可释放连接。现在A和B都处于ESTABLISHED状态
- A把连接释放报文段首部的终止控制位FIN置1,其序号seq=u,它等于前面已传送过的数据的最后一个字节的序号加1。这时A进入
FIN-WAIT-1
(终止等待1)状态,等待B的确认(注意,TCP规定,FIN报文段即使不携带数据,它也消耗掉一个序号。) - B收到连接释放报文段后即发出确认,确认号是ack=u+1,而这个报文段自己的序号是v,等于B前面已传送过的数据的最后一个字节的序号加1。然后B就进入
CLOSE-WAIT
(关闭等待)状态。- 注意:从A到B这个方向的连接就释放了,这时的TCP连接处于半关闭(half-close)状态,即A已经没有数据要发送了,但B若发送数据,A仍要接收。这个状态可能会持续一段时间
- A收到来自B的确认后,就进入
FIN-WAIT-2
(终止等待2)状态,等待B发出的连接释放报文段
- 若B已经没有要向A发送的数据,其应用进程就通知TCP释放连接。这时B发出的连接释放报文段必须使FIN=1。现假定B的序号为w(在半关闭状态B可能又发送了一些数据)。B还必须重复上次已发送过的确认号ack=u+1。这时B就进入
LAST-ACK
(最后确认)状态,等待A的确认 - A在收到B的连接释放报文段后,必须对此发出确认。在确认报文段中把ACK置1,确认号ack=w+1,而自己的序号是seq=u+1(根据TCP标准,前面发送过的FIN报文段要消耗一个序号)。然后进入到
TIME-WAIT(
时间等待)状态- 注意,现在TCP连接还没有释放掉。必须经过时间等待计时器(TIME-WAIT timer)设置的时间2MSL后,A才进入到
CLOSED
状态
- 注意,现在TCP连接还没有释放掉。必须经过时间等待计时器(TIME-WAIT timer)设置的时间2MSL后,A才进入到
- 当A撤销相应的传输控制块TCB后,就结束了这次的TCP连接
为什么A在TIME-WAIT状态必须等待2MSL的时间呢?
- 第一,为了保证A发送的最后一个ACK报文段能够到达B。这个ACK报文段有可能丢失,因而使处在LAST-ACK状态的B收不到对已发送的FIN+ACK报文段的确认。B会超时重传这个FIN+ACK报文段,而A就能在2MSL时间内收到这个重传的FIN+ACK报文段。接着A重传一次确认,重新启动2MSL计时器。最后,A和B都正常进入到CLOSED状态。如果A在TIME-WAIT状态不等待一段时间,而是在发送完ACK报文段后立即释放连接,那么就无法收到B重传的FIN+ACK报文段,因而也不会再发送一次确认报文段。这样,B就无法按照正常步骤进入CLOSED状态。
- 第二,防止
已失效的连接请求报文段 todo
出现在本连接中。A在发送完最后一个ACK报文段后,再经过时间2MSL,就可以使本连接持续的时间内所产生的所有报文段都从网络中消失。这样就可以使下一个新的连接中不会出现这种旧的连接请求报文段。
TCP的有限状态机
- 每个方框中的大写英文字符串是TCP标准所使用的TCP连接状态名
- 粗实线箭头表示对客户进程的正常变迁。
- 粗虚线箭头表示对服务器进程的正常变迁。
- 另一种细线箭头表示异常变迁。
TCP流量控制
流量控制(flow control)就是让发送方的发送速率不要太快,要让接收方来得及接收
接收方主机B进行了三次流量控制。第一次把窗口减小到rwnd=300,第二次减到rwnd=100,最后减到rwnd=0
- 考虑一种情况。B向A发送了零窗口的报文段后不久,B的接收缓存又有了一些存储空间。于是B向A发送了rwnd=400的报文段。然而这个报文段在传送过程中丢失了。A一直等待收到B发送的非零窗口的通知,而B也一直等待A发送的数据。如果没有其他措施,这种互相等待的死锁局面将一直延续下去
- 为解决这个问题,TCP为每个连接设有一个持续计时器。只要TCP连接的一方收到对方的零窗口通知,就启动持续计时器。若持续计时器设置的时间到期,就发送1个零窗口探测报文段(仅携带1字节的数据),对方在确认这个报文段时给出现在的窗口值
- 如果窗口仍是0,那么收到这个报文段的一方就重置持续计时器。如果窗口不是零,那么死锁的僵局就可以打破了。